Privacy Vibe Coding

v1Experimentell

Programmieren mit KI zu 100% offline — für Devs und Compliance-Teams, die ein lokales Modell via Ollama in VS Code nutzen, ohne dass Code das Gerät verlässt.

Derselbe VS-Code-Flow wie bei IDE Vibe Coding — nur dass das Modell auf deinem Laptop läuft und kein einziger Token die Firma verlässt. Die Antworten sind langsamer und weniger präzise als Opus 4.7, dafür sind rechtliche Freigaben für NDA-Kunden oder interne Security-Projekte kein Thema.

⇗ erbt von IDE Vibe Coding

So fühlt sich das an

Security-Audit an NDA-Code

Stell dir vor: Ein Kunde hat euch unter NDA Code gegeben, um eine Sicherheitslücke zu prüfen. Du darfst ihn nicht hochladen, nicht an externe APIs senden, nicht mal grob außerhalb des Teams beschreiben. Du öffnest das Repo in VS Code, startest Claude Code gegen `ollama run gemma4`, alles läuft lokal. Die Analyse ist langsamer, aber jede Zeile, die Claude sieht, bleibt auf deinem Laptop. Zwei Stunden später hast du ein Findings-Dokument, ohne dass irgendein externer Dienst involviert war.

Struktur

Wie Privacy Vibe Coding zusammenhängt

Beide Personen arbeiten auf einem Klon desselben Repos. CLAUDE.md, Skills und Settings kommen aus dem gemeinsamen Git-Repo — persönliche User-Skills bleiben lokal. Der gestrichelte Subgraph zeigt die geerbten Komponenten.

Wofür du das brauchst

Wann Privacy Vibe Coding passt

4 Situationen aus dem Tour-Online-Alltag. Wenn sich eine davon vertraut anfühlt, bist du hier richtig.

NDA-Kundencode reviewen

Ein Kunde gibt euch Code unter NDA. Du darfst ihn nicht an Anthropic oder OpenAI senden. Privacy Vibe Coding nimmt denselben Workflow wie IDE Vibe Coding mit — nur bleibt das Modell und damit der Code vollständig auf deinem Laptop.

Interne Security-Audits

Core-Auth-Flows, Encryption-Module, Access-Control-Listen — alles, was du lieber nicht über eine externe API schickst. Gemma 4 läuft lokal, Claude Code ist nur das Harness — der Rest nie im Internet.

Arbeit ohne Netz

ICE ohne Empfang, Flug, Kunden-Office ohne Gäste-WLAN. Solange Ollama läuft und das Modell geladen ist, arbeitest du genauso wie im Büro — Prompts, Diffs, Tests, alles lokal.

Experimente mit sensiblen Daten

Kundendaten-Muster, PII in Testdatensätzen, interne Log-Samples — wenn selbst Test-Daten nicht extern dürfen, ist Privacy Vibe Coding dein Sandbox-Setup.

Voraussetzungen

Was du dafür brauchst

Einmal eingerichtet, dann fließt es. Die meisten Bausteine bekommst du firmenweit über deinen Tour-Online-Account.

Zugänge

Ollama lokal installiert
Lokaler Inference-Server. Brew auf Mac, Package auf Linux/Windows.
Download ↗
Mac mit 24 GB+ Unified Memory
Gemma 4 27B in Q4-Quantisierung braucht mindestens 24 GB RAM. MacBook Pro M3 Pro/Max oder vergleichbar.
GitHub-Org tour-online
Zugriff auf die Team-Repos über IT beantragen.
IT-Ticket
Slack-Channel #ki-workflow
Fragen, Tipps und Showcases aus dem Kollegium.

Zeit-Invest

Setup: 2 Stunden (Ollama + Gemma-4-Download)
First Value: ca. 1 Tag
Proficiency: ~2 Wochen

Technischer Ablauf

So arbeitest du mit Privacy Vibe Coding

01
Ollama installieren
Ein einziger Brew-Install auf dem Mac — Windows und Linux analog. Läuft als Service im Hintergrund und stellt einen lokalen Inference-Endpoint bereit.
```
brew install ollama && brew services start ollama
```
02
Gemma 4 ziehen
Die Q4-Quantisierung passt in 24 GB RAM und ist die schnellste Gemma-Variante, die für Code-Arbeit taugt. Download ist einmalig ~15 GB.
```
ollama pull gemma4:27b-q4_K_M
```
03
Claude Code gegen lokales Modell konfigurieren
Claude Code akzeptiert einen Alternate-Endpoint. Einmal in der Shell setzen, dann fließt jede Session über Ollama statt Anthropic.
```
export ANTHROPIC_BASE_URL=http://localhost:11434 && claude --model gemma4
```
04
Repo laden und loslegen
Alles wie bei IDE Vibe Coding: VS Code öffnen, Claude Code im Terminal, Task beschreiben, Diff reviewen. Nur deutlich langsamer — plan mit 3–5x Antwortzeit gegenüber Opus 4.7.
05
Iterationsstil anpassen
Gemma 4 braucht präzisere Prompts. Explizite Datei-Pfade, kurze Ziel-Beschreibung, maximal 1–2 Features pro Turn. Lieber drei Small-Wins als ein Mega-Task.
06
Testen lokal
Jede generierte Änderung wie gewohnt mit den Projekt-Tests prüfen. Qualität ist schwächer — rechne mit 1–2 Iterationen mehr.
```
npm test
```
07
Commit mit Compliance-Vermerk
Commit-Message trägt kurzen Vermerk: „generiert via Privacy Vibe Coding / Gemma 4 lokal". Macht im Audit-Log transparent, welcher Code unter welchem Workflow entstanden ist.

Häufige Stolpersteine

Wenn etwas hakt

Die 5 Fragen, die am häufigsten ins Slack-Channel kommen — mit Antwort. Wenn deiner fehlt, freut sich der Kanal.

Ollama startet nicht: `brew services restart ollama`. Wenn Port 11434 blockiert ist: `lsof -i :11434` zeigt, welcher Prozess ihn hält. Anderen Prozess stoppen oder Ollama auf anderen Port umstellen (`OLLAMA_HOST=127.0.0.1:11435`).
Gemma ist zu langsam: Q4-Quantisierung ist der Sweet Spot — Q8 ist doppelt so langsam bei wenig Qualitätsgewinn. Alternative: Gemma 4 2B für einfachere Tasks (schneller, weniger präzise). Oder auf Mac Studio mit 64+ GB Unified Memory umziehen.
Claude Code erreicht das lokale Modell nicht: `curl http://localhost:11434/api/tags` muss die verfügbaren Modelle zurückgeben. Wenn nicht: Ollama läuft nicht. `ANTHROPIC_BASE_URL` gesetzt? `echo $ANTHROPIC_BASE_URL` — sollte `http://localhost:11434` zeigen.
Antworten sind weniger präzise als erwartet: Gemma 4 braucht präzisere Prompts als Opus. Kürzer, expliziter, ein Ziel pro Turn. Wenn eine Antwort falsch ist, nicht „versuch nochmal", sondern konkret: „Zeile X war falsch, weil Y — versuche Z".
Wie erkenne ich Erfolg?: Finding-Dokument fertig + Audit-Log lückenlos + Kunde kann NDA-Abschluss bestätigen, weil sein Code nie extern war. Für Privacy Vibe Coding zählt Output-Qualität weniger als Compliance-Sauberkeit.

Tour-Online-Empfehlungen

Skills, MCPs, Settings — so setzen wir das auf

5 Empfehlungen, die das Team bei uns teilt. Keine harte Vorschrift, aber erspart dir Lehrgeld. Jeder Eintrag lebt als eigenständiger Datensatz — wiederverwendbar über mehrere Stacks.

01
Ollama nur on-demand starten
Setting
Ollama im Hintergrund zieht Strom und RAM, auch wenn du nicht mit KI arbeitest. Per `brew services stop` pausieren, wenn keine Sessions anstehen.
brew services stop ollama # nach Feierabend
02
Compliance-Log pro NDA-Session
Workflow
Wenn du unter NDA arbeitest, dokumentiere Datum, Kunde, Scope der Arbeit. Ein kurzer Markdown-Eintrag pro Session — Audit-Trail für Legal und für dich selbst.
03
Lokale Modelle wöchentlich aktualisieren
Workflow
Gemma 4 bekommt regelmäßig Patches. `ollama pull gemma4:27b-q4_K_M` einmal die Woche laufen lassen, damit du nicht auf veralteten Gewichten arbeitest.
ollama pull gemma4:27b-q4_K_M
04
Non-Sensitive Tasks lieber auf IDE Vibe Coding
Workflow
Nicht alles ist NDA. Wenn der Task kein sensibles Material berührt, wechsle bewusst auf IDE Vibe Coding — schneller, präziser, weniger Reibung.
05
CLAUDE.md um Privacy-Note erweitern
Setting
Ein Satz in der CLAUDE.md: „Arbeitet offline, keine externen APIs aufrufen, keine Daten loggen." Hält den Agent auf dem richtigen Kurs, wenn er trotzdem mal online-Tools anbietet.
CLAUDE.md → Abschnitt „Privacy-Mode"

Weiterlernen & Referenzen

Wo du tiefer einsteigen kannst

6 kuratierte Ressourcen — offizielle Doku, Tutorials, Videos, Deep-Dive-Artikel und Community-Kanäle. Nach Einstiegstiefe geordnet, damit du genau die nächste Runde Lernen findest.

Doku · 1

Ollama — offizielle Dokumentation ↗
Installation, CLI, API-Endpoint und Modell-Management.
Ollama · Einstieg

Tutorial · 2

Gemma 4 Modellkarte auf Ollama ↗
Verfügbare Quantisierungen, VRAM-Anforderungen, Kontextfenster.
Ollama · Einstieg
Simon Willison: LLM mit Ollama-Plugin ↗
Blog-Post, der das LLM-Cli-Tool von Simon mit Ollama kombiniert — Inspiration für eigene Workflows.
Simon Willison · Fortgeschritten · 10 Min

Video · 1

▶ Ollama Tutorials von Matt Williams (YouTube)Öffnet auf YouTube ↗
Ehemaliger Ollama-Maintainer — die beste Video-Reihe zu lokalen Modellen.

Deep Dive · 1

Gemma 4 Model Card (Google DeepMind) ↗
Architektur, Training, Benchmarks — für wen Gemma 4 gedacht ist.
Google DeepMind · Tief · 15 Min

Community · 1

Ollama — Discord-Community ↗
Fragen zum lokalen Setup, Quantisierungen, Hardware-Kompatibilität.
Ollama · Einstieg

Reifegrad

Basteln oder enterprise-tauglich?

Experimentell

Einsatzfähig für NDA-Projekte, aber langsamer. Gemma 4 via Ollama ist reif genug für echte Arbeit, aber die Qualität liegt spürbar unter Opus 4.7. Wir setzen Privacy Vibe Coding gezielt ein, wenn Compliance zwingend ist — nicht als Standard-Workflow.

Wofür Privacy Vibe Coding funktioniert

✓
Compliance-kritische Projekte
Genau dafür gebaut. Kein externer Netzverkehr, keine Token-Leaks.
✓
NDA-Kundencode
Der Hauptanwendungsfall — Code bleibt im Haus.
✓
Security-Reviews interner Systeme
Sensible Code-Stellen bleiben lokal, Auditable.
✓
Arbeit ohne Netzverbindung
Einmal vorbereitet — danach funktioniert alles offline.
!
Standard-Feature-Entwicklung
Möglich, aber spürbar langsamer als IDE Vibe Coding mit Opus 4.7.
!
Zeitkritische Deadlines
Plan 3–5x mehr Zeit ein. Wenn Compliance erlaubt, lieber auf IDE Vibe Coding ausweichen.
✗
Teams ohne starke GPU
Gemma 4 27B braucht 24 GB RAM/VRAM. Macbook Pro M3 oder vergleichbar.
✗
Trainings-Runs oder Fine-Tuning
Ollama ist Inference-only. Fürs Training andere Tools.

Nicht dafür gedacht

—Standardarbeit ohne Compliance-Druck (zu langsam, schwächere Antworten)
—Aufgaben, die mehr als 100k Kontext-Tokens brauchen
—Teams ohne Mac mit starker GPU oder 24GB+ RAM

Ansprechbar im Haus

Frag sie — sie machen das auch

4 Kolleg:innen, die diese Constellation täglich nutzen. Keine Scheu — sie helfen gern, wenn du einsteigst oder irgendwo hängst.

Wernau

Jonas Weber

Tech-Lead & Platform

Hat die Privacy-Vibe-Konfiguration für Tour Online gebaut. Ansprechpartner für Compliance-Setup, Modell-Wahl und Hardware-Anforderungen.

@jonas (Slack)

Wernau

Anna Berger

Security & Compliance

Rechtliche Freigaben für NDA-Projekte und Review der Audit-Trails. Muss wissen, welche Constellations wo laufen.

@aberger (Slack)

Leipzig

Marco Bender

Backend-Engineer

Entwickelt gerade die erste NDA-Kundenpipeline mit Privacy Vibe Coding. Erfahrung mit Gemma 4 und Ollama.

@marco (Slack)

Leipzig

Tobias Klaus

DevOps

Baut reproduzierbare Ollama-Environments für das Team. Gute Adresse, wenn der lokale Setup-Schritt hakt.

@toklaus (Slack)

Beispielprofile · echte Zuordnung folgt mit User-&-Rollen-Schema

Vererbung

Erbt von IDE Vibe Coding

Best PracticeAlle Komponenten werden übernommen — außer denen unten.

Was wird überschrieben?

Modell
Opus 4.7→Gemma 4 · 27B Q4_K_M
27B Q4_K_M passt für ~16 GB VRAM. Kleinere Hardware → 12B oder 4B-Variante wählen.

Zusätzlich in dieser Variante

AnbieterOllama

Originaltext aus dem Register

Erbt IDE Vibe Coding komplett: VS Code + Claude Code. Ersetzt nur das Cloud-Modell durch ein lokales Gemma 4 über Ollama. Qualität liegt deutlich unter Opus, aber das Code-Sample bleibt streng privat.

Verwandte Stacks

War diese Seite hilfreich?

Zwei Klicks — und das Redaktionsteam weiß, was funktioniert und was fehlt. Optional kannst du einen Satz dazuschreiben.

Was fehlt dir? (optional)

Privacy Vibe Coding

Security-Audit an NDA-Code

Wie Privacy Vibe Coding zusammenhängt

Wann Privacy Vibe Coding passt

NDA-Kundencode reviewen

Interne Security-Audits

Arbeit ohne Netz

Experimente mit sensiblen Daten

Was du dafür brauchst

Zugänge

So arbeitest du mit Privacy Vibe Coding

Ollama installieren

Gemma 4 ziehen

Claude Code gegen lokales Modell konfigurieren

Repo laden und loslegen

Iterationsstil anpassen

Testen lokal

Commit mit Compliance-Vermerk

Wenn etwas hakt

Skills, MCPs, Settings — so setzen wir das auf

Ollama nur on-demand starten

Compliance-Log pro NDA-Session

Lokale Modelle wöchentlich aktualisieren

Non-Sensitive Tasks lieber auf IDE Vibe Coding

CLAUDE.md um Privacy-Note erweitern