Privacy Vibe Coding

v1Experimentell

Programmieren mit KI zu 100% offline — für Devs und Compliance-Teams, die ein lokales Modell via Ollama in VS Code nutzen, ohne dass Code das Gerät verlässt.

Derselbe VS-Code-Flow wie bei IDE Vibe Coding — nur dass das Modell auf deinem Laptop läuft und kein einziger Token die Firma verlässt. Die Antworten sind langsamer und weniger präzise als Opus 4.7, dafür sind rechtliche Freigaben für NDA-Kunden oder interne Security-Projekte kein Thema.

So fühlt sich das an

Security-Audit an NDA-Code

Stell dir vor: Ein Kunde hat euch unter NDA Code gegeben, um eine Sicherheitslücke zu prüfen. Du darfst ihn nicht hochladen, nicht an externe APIs senden, nicht mal grob außerhalb des Teams beschreiben. Du öffnest das Repo in VS Code, startest Claude Code gegen `ollama run gemma4`, alles läuft lokal. Die Analyse ist langsamer, aber jede Zeile, die Claude sieht, bleibt auf deinem Laptop. Zwei Stunden später hast du ein Findings-Dokument, ohne dass irgendein externer Dienst involviert war.

Struktur

Wie Privacy Vibe Coding zusammenhängt

Beide Personen arbeiten auf einem Klon desselben Repos. CLAUDE.md, Skills und Settings kommen aus dem gemeinsamen Git-Repo — persönliche User-Skills bleiben lokal. Der gestrichelte Subgraph zeigt die geerbten Komponenten.

Wofür du das brauchst

Wann Privacy Vibe Coding passt

4 Situationen aus dem Tour-Online-Alltag. Wenn sich eine davon vertraut anfühlt, bist du hier richtig.

01

NDA-Kundencode reviewen

Ein Kunde gibt euch Code unter NDA. Du darfst ihn nicht an Anthropic oder OpenAI senden. Privacy Vibe Coding nimmt denselben Workflow wie IDE Vibe Coding mit — nur bleibt das Modell und damit der Code vollständig auf deinem Laptop.

02

Interne Security-Audits

Core-Auth-Flows, Encryption-Module, Access-Control-Listen — alles, was du lieber nicht über eine externe API schickst. Gemma 4 läuft lokal, Claude Code ist nur das Harness — der Rest nie im Internet.

03

Arbeit ohne Netz

ICE ohne Empfang, Flug, Kunden-Office ohne Gäste-WLAN. Solange Ollama läuft und das Modell geladen ist, arbeitest du genauso wie im Büro — Prompts, Diffs, Tests, alles lokal.

04

Experimente mit sensiblen Daten

Kundendaten-Muster, PII in Testdatensätzen, interne Log-Samples — wenn selbst Test-Daten nicht extern dürfen, ist Privacy Vibe Coding dein Sandbox-Setup.

Voraussetzungen

Was du dafür brauchst

Einmal eingerichtet, dann fließt es. Die meisten Bausteine bekommst du firmenweit über deinen Tour-Online-Account.

Zugänge

  • Ollama lokal installiert

    Lokaler Inference-Server. Brew auf Mac, Package auf Linux/Windows.

    Download
  • Mac mit 24 GB+ Unified Memory

    Gemma 4 27B in Q4-Quantisierung braucht mindestens 24 GB RAM. MacBook Pro M3 Pro/Max oder vergleichbar.

  • GitHub-Org tour-online

    Zugriff auf die Team-Repos über IT beantragen.

    IT-Ticket
  • Slack-Channel #ki-workflow

    Fragen, Tipps und Showcases aus dem Kollegium.

Zeit-Invest

Setup
2 Stunden (Ollama + Gemma-4-Download)
First Value
ca. 1 Tag
Proficiency
~2 Wochen

Technischer Ablauf

So arbeitest du mit Privacy Vibe Coding

  1. 01

    Ollama installieren

    Ein einziger Brew-Install auf dem Mac — Windows und Linux analog. Läuft als Service im Hintergrund und stellt einen lokalen Inference-Endpoint bereit.

    brew install ollama && brew services start ollama
  2. 02

    Gemma 4 ziehen

    Die Q4-Quantisierung passt in 24 GB RAM und ist die schnellste Gemma-Variante, die für Code-Arbeit taugt. Download ist einmalig ~15 GB.

    ollama pull gemma4:27b-q4_K_M
  3. 03

    Claude Code gegen lokales Modell konfigurieren

    Claude Code akzeptiert einen Alternate-Endpoint. Einmal in der Shell setzen, dann fließt jede Session über Ollama statt Anthropic.

    export ANTHROPIC_BASE_URL=http://localhost:11434 && claude --model gemma4
  4. 04

    Repo laden und loslegen

    Alles wie bei IDE Vibe Coding: VS Code öffnen, Claude Code im Terminal, Task beschreiben, Diff reviewen. Nur deutlich langsamer — plan mit 3–5x Antwortzeit gegenüber Opus 4.7.

  5. 05

    Iterationsstil anpassen

    Gemma 4 braucht präzisere Prompts. Explizite Datei-Pfade, kurze Ziel-Beschreibung, maximal 1–2 Features pro Turn. Lieber drei Small-Wins als ein Mega-Task.

  6. 06

    Testen lokal

    Jede generierte Änderung wie gewohnt mit den Projekt-Tests prüfen. Qualität ist schwächer — rechne mit 1–2 Iterationen mehr.

    npm test
  7. 07

    Commit mit Compliance-Vermerk

    Commit-Message trägt kurzen Vermerk: „generiert via Privacy Vibe Coding / Gemma 4 lokal". Macht im Audit-Log transparent, welcher Code unter welchem Workflow entstanden ist.

Häufige Stolpersteine

Wenn etwas hakt

Die 5 Fragen, die am häufigsten ins Slack-Channel kommen — mit Antwort. Wenn deiner fehlt, freut sich der Kanal.

Ollama startet nicht
`brew services restart ollama`. Wenn Port 11434 blockiert ist: `lsof -i :11434` zeigt, welcher Prozess ihn hält. Anderen Prozess stoppen oder Ollama auf anderen Port umstellen (`OLLAMA_HOST=127.0.0.1:11435`).
#ollama#setup
Gemma ist zu langsam
Q4-Quantisierung ist der Sweet Spot — Q8 ist doppelt so langsam bei wenig Qualitätsgewinn. Alternative: Gemma 4 2B für einfachere Tasks (schneller, weniger präzise). Oder auf Mac Studio mit 64+ GB Unified Memory umziehen.
#performance#quantization
Claude Code erreicht das lokale Modell nicht
`curl http://localhost:11434/api/tags` muss die verfügbaren Modelle zurückgeben. Wenn nicht: Ollama läuft nicht. `ANTHROPIC_BASE_URL` gesetzt? `echo $ANTHROPIC_BASE_URL` — sollte `http://localhost:11434` zeigen.
#claude-code#endpoint
Antworten sind weniger präzise als erwartet
Gemma 4 braucht präzisere Prompts als Opus. Kürzer, expliziter, ein Ziel pro Turn. Wenn eine Antwort falsch ist, nicht „versuch nochmal", sondern konkret: „Zeile X war falsch, weil Y — versuche Z".
#prompting
Wie erkenne ich Erfolg?
Finding-Dokument fertig + Audit-Log lückenlos + Kunde kann NDA-Abschluss bestätigen, weil sein Code nie extern war. Für Privacy Vibe Coding zählt Output-Qualität weniger als Compliance-Sauberkeit.
#success-criteria

Tour-Online-Empfehlungen

Skills, MCPs, Settings — so setzen wir das auf

5 Empfehlungen, die das Team bei uns teilt. Keine harte Vorschrift, aber erspart dir Lehrgeld. Jeder Eintrag lebt als eigenständiger Datensatz — wiederverwendbar über mehrere Stacks.

  1. 01

    Ollama nur on-demand starten

    Setting

    Ollama im Hintergrund zieht Strom und RAM, auch wenn du nicht mit KI arbeitest. Per `brew services stop` pausieren, wenn keine Sessions anstehen.

    brew services stop ollama # nach Feierabend
  2. 02

    Compliance-Log pro NDA-Session

    Workflow

    Wenn du unter NDA arbeitest, dokumentiere Datum, Kunde, Scope der Arbeit. Ein kurzer Markdown-Eintrag pro Session — Audit-Trail für Legal und für dich selbst.

  3. 03

    Lokale Modelle wöchentlich aktualisieren

    Workflow

    Gemma 4 bekommt regelmäßig Patches. `ollama pull gemma4:27b-q4_K_M` einmal die Woche laufen lassen, damit du nicht auf veralteten Gewichten arbeitest.

    ollama pull gemma4:27b-q4_K_M
  4. 04

    Non-Sensitive Tasks lieber auf IDE Vibe Coding

    Workflow

    Nicht alles ist NDA. Wenn der Task kein sensibles Material berührt, wechsle bewusst auf IDE Vibe Coding — schneller, präziser, weniger Reibung.

  5. 05

    CLAUDE.md um Privacy-Note erweitern

    Setting

    Ein Satz in der CLAUDE.md: „Arbeitet offline, keine externen APIs aufrufen, keine Daten loggen." Hält den Agent auf dem richtigen Kurs, wenn er trotzdem mal online-Tools anbietet.

    CLAUDE.md → Abschnitt „Privacy-Mode"

Weiterlernen & Referenzen

Wo du tiefer einsteigen kannst

6 kuratierte Ressourcen — offizielle Doku, Tutorials, Videos, Deep-Dive-Artikel und Community-Kanäle. Nach Einstiegstiefe geordnet, damit du genau die nächste Runde Lernen findest.

Doku · 1

Tutorial · 2

Video · 1

Deep Dive · 1

Community · 1

Reifegrad

Basteln oder enterprise-tauglich?

Experimentell

Einsatzfähig für NDA-Projekte, aber langsamer. Gemma 4 via Ollama ist reif genug für echte Arbeit, aber die Qualität liegt spürbar unter Opus 4.7. Wir setzen Privacy Vibe Coding gezielt ein, wenn Compliance zwingend ist — nicht als Standard-Workflow.

Wofür Privacy Vibe Coding funktioniert

  • Compliance-kritische Projekte

    Genau dafür gebaut. Kein externer Netzverkehr, keine Token-Leaks.

  • NDA-Kundencode

    Der Hauptanwendungsfall — Code bleibt im Haus.

  • Security-Reviews interner Systeme

    Sensible Code-Stellen bleiben lokal, Auditable.

  • Arbeit ohne Netzverbindung

    Einmal vorbereitet — danach funktioniert alles offline.

  • !
    Standard-Feature-Entwicklung

    Möglich, aber spürbar langsamer als IDE Vibe Coding mit Opus 4.7.

  • !
    Zeitkritische Deadlines

    Plan 3–5x mehr Zeit ein. Wenn Compliance erlaubt, lieber auf IDE Vibe Coding ausweichen.

  • Teams ohne starke GPU

    Gemma 4 27B braucht 24 GB RAM/VRAM. Macbook Pro M3 oder vergleichbar.

  • Trainings-Runs oder Fine-Tuning

    Ollama ist Inference-only. Fürs Training andere Tools.

Nicht dafür gedacht

  • Standardarbeit ohne Compliance-Druck (zu langsam, schwächere Antworten)
  • Aufgaben, die mehr als 100k Kontext-Tokens brauchen
  • Teams ohne Mac mit starker GPU oder 24GB+ RAM

Ansprechbar im Haus

Frag sie — sie machen das auch

4 Kolleg:innen, die diese Constellation täglich nutzen. Keine Scheu — sie helfen gern, wenn du einsteigst oder irgendwo hängst.

Wernau

Jonas Weber

Tech-Lead & Platform

Hat die Privacy-Vibe-Konfiguration für Tour Online gebaut. Ansprechpartner für Compliance-Setup, Modell-Wahl und Hardware-Anforderungen.

@jonas (Slack)
Wernau

Anna Berger

Security & Compliance

Rechtliche Freigaben für NDA-Projekte und Review der Audit-Trails. Muss wissen, welche Constellations wo laufen.

@aberger (Slack)
Leipzig

Marco Bender

Backend-Engineer

Entwickelt gerade die erste NDA-Kundenpipeline mit Privacy Vibe Coding. Erfahrung mit Gemma 4 und Ollama.

@marco (Slack)
Leipzig

Tobias Klaus

DevOps

Baut reproduzierbare Ollama-Environments für das Team. Gute Adresse, wenn der lokale Setup-Schritt hakt.

@toklaus (Slack)

Beispielprofile · echte Zuordnung folgt mit User-&-Rollen-Schema

Vererbung

Erbt von IDE Vibe Coding

Best PracticeAlle Komponenten werden übernommen — außer denen unten.

Was wird überschrieben?

  • Modell
    Opus 4.7Gemma 4 · 27B Q4_K_M

    27B Q4_K_M passt für ~16 GB VRAM. Kleinere Hardware → 12B oder 4B-Variante wählen.

Zusätzlich in dieser Variante

  • AnbieterOllama

Originaltext aus dem Register

Erbt IDE Vibe Coding komplett: VS Code + Claude Code. Ersetzt nur das Cloud-Modell durch ein lokales Gemma 4 über Ollama. Qualität liegt deutlich unter Opus, aber das Code-Sample bleibt streng privat.

Dein Feedback

War diese Seite hilfreich?

Zwei Klicks — und das Redaktionsteam weiß, was funktioniert und was fehlt. Optional kannst du einen Satz dazuschreiben.