Qwen3.5

Base-Familie (Dense) der Qwen-Generation 3.5, Sizes 0.8B/2B/4B. Reasoning-Mode optional per Flag.

Intelligence: –
Kontext: 262k Tokens
Status: Aktiv
Reasoning: nein
Release: 15. Sept. 2025
Lizenz: open_weight
Positionierung: allrounder

Verfügbar in 1 App

Wo finde ich Qwen3.5?

CLI
Claude Code
lokal
viaOllama
Offline-Setup: Claude Code mit Qwen3.5 4B-Quant lokal — akzeptable Qualität, kein Daten-Transfer.

Anbieter & Preise

Wo läuft Qwen3.5?

Anbieter	Region	Datenschutz	Input $/1M	Output $/1M	Blended $/1M
Ollama	own	Unbedenklich	–	–	gratis
LM Studio	own	Unbedenklich	–	–	gratis
MLX	own	Unbedenklich	–	–	gratis

Fähigkeiten

Was kann das Modell?

Vision Input· inputTool-Use· toolStructured Output· tool

Varianten · Open-Weight-Sizes & Quantisierungen

Was läuft wo lokal?

Parameter-Größe	Quantisierung	Ressource	Qualität	Hinweis
0.8B	FP16	~1.6 GB VRAM	Baseline (FP16)	Smallest — mobile/IoT, cheapest model overall (AA $0.02)
0.8B	Q4_K_M	~600 MB	minimal	Smartphone-tauglich, sehr schnell
2B	FP16	~4 GB VRAM	Baseline (FP16)	Low-latency-Modell laut AA
2B	Q4_K_M	~1.5 GB	gering	Laptop-CPU-tauglich
4B	FP16	~8 GB VRAM	Baseline (FP16)	M-Serie MacBooks, consumer GPUs
4B	Q8_0	~4.5 GB	praktisch verlustfrei	Sweet-Spot für lokales Coding
4B	Q4_K_M	~2.6 GB	gering	Smartphone High-End / alte Laptops