Qwen3.5
Base-Familie (Dense) der Qwen-Generation 3.5, Sizes 0.8B/2B/4B. Reasoning-Mode optional per Flag.
- Intelligence
- –
- Kontext
- 262k Tokens
- Status
- Aktiv
- Reasoning
- nein
- Release
- 15. Sept. 2025
- Lizenz
- open_weight
- Positionierung
- allrounder
Verfügbar in 1 App
Wo finde ich Qwen3.5?
- CLIClaude CodelokalviaOllama
Offline-Setup: Claude Code mit Qwen3.5 4B-Quant lokal — akzeptable Qualität, kein Daten-Transfer.
Fähigkeiten
Was kann das Modell?
Vision Input· inputTool-Use· toolStructured Output· tool
Varianten · Open-Weight-Sizes & Quantisierungen
Was läuft wo lokal?
| Parameter-Größe | Quantisierung | Ressource | Qualität | Hinweis |
|---|---|---|---|---|
| 0.8B | FP16 | ~1.6 GB VRAM | Baseline (FP16) | Smallest — mobile/IoT, cheapest model overall (AA $0.02) |
| 0.8B | Q4_K_M | ~600 MB | minimal | Smartphone-tauglich, sehr schnell |
| 2B | FP16 | ~4 GB VRAM | Baseline (FP16) | Low-latency-Modell laut AA |
| 2B | Q4_K_M | ~1.5 GB | gering | Laptop-CPU-tauglich |
| 4B | FP16 | ~8 GB VRAM | Baseline (FP16) | M-Serie MacBooks, consumer GPUs |
| 4B | Q8_0 | ~4.5 GB | praktisch verlustfrei | Sweet-Spot für lokales Coding |
| 4B | Q4_K_M | ~2.6 GB | gering | Smartphone High-End / alte Laptops |