Wie wir selbst mit Coding Agents bauen
Wir verkaufen nicht nur KI-Rollouts — wir betreiben unsere eigene Entwicklung mit Agenten. Kein Pitch, sondern unser echter Alltag: Wie ein Feature von der Idee bis zum Merge Request läuft, welche Zahlen sich verändert haben — und wo die ehrlichen Grenzen liegen.
Drei Kennzahlen — und die halbe Wahrheit
Ø Feb–Okt 2025 vs. Mär–Mai 2026 · ~1,2–1,3× davon durch Team-Wachstum
Warum diese Zahlen nur die halbe Wahrheit sind
Commits, MRs und Releases sind bequeme, aber schwache Maße — mehr Codezeilen heißt nicht mehr Wert. Der eigentliche Wandel ist nicht „schneller tippen", sondern dass sich der gesamte Entwicklungsprozess verschiebt: Er beginnt früher (Tickets werden zu Prompts) und endet später (Agenten verifizieren, refactoren, dokumentieren). Wir zeigen die Zahlen, weil sie real sind — aber der Hebel sitzt im Prozess, nicht in der Statistik.
Der Loop hinter jedem Feature
Jedes Feature läuft denselben Weg — am Beispiel eines echten Tickets („Screenshot im Chat aufnehmen"): von der Idee bis zum fertigen Merge Request.
Das reine Implementieren des Beispiel-Features dauerte rund drei Minuten — inklusive automatischer Übersetzung in vier Sprachen und einem fertigen Changelog-Fragment. Die Arbeit verschiebt sich von „Code schreiben" zu „Kontext geben und Ergebnisse prüfen".
Abrufen · Handeln · Verifizieren — in der Praxis
Unser Setup ist nichts anderes als das Agenten-Dreieck in Reinform — jede Spitze hat ihre Werkzeuge:
Die dritte Spitze ist die, die fast alle vergessen — und die wir am ernstesten nehmen: Der Agent startet selbst einen Browser, klickt sich wie ein Nutzer durch das neue Feature und prüft Ende-zu-Ende, ob es wirklich funktioniert. Kein Mensch muss den ersten Klick machen.
Der Stack dahinter
- Live-Kontext: mehrere MCP-Server an Claude Code — Linear (Tickets), Sentry (Errors → Fix), Context7 (aktuelle Doku).
- Eine Quelle der Wahrheit: eine
AGENTS.md, die alle Coding-Agents teilen;CLAUDE.mdreferenziert sie nur. - Schnelle Werkzeuge: Wechsel von ESLint zu Oxlint brachte den Pre-Commit-Check von ~1 Minute auf ~3 Sekunden — bei jedem der vielen täglichen Agent-Läufe ein echter Hebel.
- Sauber halten: Knip filtert ungenutzten Code/Exports raus, damit KI-Code keine technische Schuld wird.
- Zwei Köpfe: Codex für Architektur, Backend & Security; Claude für Frontend, UX & Tool-Calling — ein Agent dirigiert beide und führt zusammen.
- Letzter Torwart: CodeRabbit reviewt jeden MR automatisch, fängt Bugs und setzt Guardrails durch (Stil, erlaubte Libraries, geschützte Ordner).
Die Rolle verschiebt sich: weg vom Tippen jeder Zeile, hin zum Koordinieren — Ziel halten, Aufgaben verteilen, Ergebnisse prüfen, zusammenführen.
Was das für dich heißt
Coding war die erste Domäne, in der Agenten vom Berater zum Macher wurden — weil sie deterministisch prüfbar und reversibel ist. Genau dieselbe Schleife übertragen wir gerade auf das ganze Unternehmen: das agentische Unternehmen. Und wo sich wiederkehrende Arbeit in Agenten und Workflows gießen lässt, zeigt die Automatisierung.