OpenAI Codex Lead: Wir haben die Sora Android App in 18 Tagen gebaut - und sie wurde #1 im Store

Lenny's Podcast
interviewdeveloper-toolsagentsgpt

Perspektive

Dies ist Alexander Embiricos - Produktleiter für OpenAI Codex - der erklärt, warum sein Coding-Agent seit August um das 20-fache gewachsen ist und warum die Vision viel größer ist als nur Autocompletion.

“Ein wirklich intelligentes Praktikum, das sich weigert, Slack zu lesen.” So beschreibt Alexander Codex heute. Es kann erstaunliche Dinge tun, wenn man es richtig anleitet, aber es schaut nicht in DataDog nach, wenn man es nicht fragt. Es beteiligt sich nicht an der Planung. Es weiß nicht, was beim Standup passiert ist. Das ist, worauf sie hinarbeiten: ein Teamkollege, kein Werkzeug.

Die Sora Android App wurde in 18 Tagen gebaut. Eine völlig neue App, dann 10 Tage später (insgesamt 28 Tage) wurde sie veröffentlicht. So beschleunigt Codex OpenAI intern. Codex ist auch im Dienst für seine eigenen Trainingsläufe - schreibt Infrastruktur-Code, Code-Review erwischt Konfigurationsfehler.

Kompression ermöglicht 24-Stunden-Agent-Läufe. Modelle arbeiten jetzt routinemäßig über Nacht. Wenn sie sich den Kontext-Grenzen nähern, ermöglicht eine neue Funktion namens “Kompression” ihnen, einen komprimierten Kontext vorzubereiten, in einem frischen Fenster neu zu starten und fortzufahren. Dies erforderte koordinierte Arbeiten über Modell-, API- und Harness-Ebenen.

Das Cloud-Produkt war noch zu fern in der Zukunft. Codex Cloud wurde zuerst gestartet - ein Remote-Computer, dem man massiv parallel delegieren konnte. Großartig für OpenAI-Mitarbeiter, die an Reasoning-Model-Prompting gewöhnt sind. Nicht großartig für breite Akzeptanz. Der Durchbruch: Landen Sie zuerst mit Benutzern in der IDE und CLI, dann graduieren Sie sie im Laufe der Zeit zur Delegation.

“Würde ich diesen Prompt geschrieben haben? Vielleicht 50/50.” Das ist gut genug. Die Aufgabe des Agenten ist nicht, perfekt zu sein - es ist, Konsistenz zu wahren und 24/7 zu laufen. Karpathys Anwendungsfall: Geben Sie ihm Ihre kniffligsten Fehler, lassen Sie ihn eine Stunde lang laufen. Er löst Probleme, die nichts anderes kann.

Wichtigste Erkenntnisse

  • 20x-Wachstum seit August - Codex-Modelle am meisten in der API bedient
  • Sora Android App in 18 Tagen - Wurde nach 28 Tagen #1 im App Store
  • Codex im Dienst für eigenes Training - Schreibt Infrastruktur, überprüft Code
  • Kompression - Ermöglicht 24-Stunden-Läufe durch Kontextkompression
  • GPT 5.11 Codex Max - 30% schneller bei gleichen Aufgaben, intelligenter bei höherem Reasoning
  • Cloud-Produkt zu futuristisch - IDE/CLI zuerst, dann Graduation zur Delegation
  • Proaktivität ist die Mission - Tausende hilfreiche Momente pro Tag, nicht Dutzende
  • “Kniffligste Fehler”-Anwendungsfall - Karpathy gibt Codex die schwierigsten Probleme über Nacht
  • 50/50 Prompts sind in Ordnung - Konsistenz und 24/7-Verfügbarkeit schlagen Perfektion
  • Dogfooding-Signal unterscheidet sich - OpenAI-Mitarbeiter zu komfortabel mit Reasoning-Prompts

Großes Bild

Codex versucht nicht, besseres Autocompletion zu sein - es versucht, ein Teamkollege zu sein, der arbeitet, während du schläfst. Der Wechsel von Werkzeug zu Kollege erfordert Proaktivität: tausende hilfreiche Momente täglich, nicht Dutzende. Wenn Ihr Coding-Agent im Dienst für seine eigenen Trainingsläufe ist, hat die rekursive Schleife der KI, die KI verbessert, begonnen.