Vedúci OpenAI Codex: Vytvorili sme Sora Android aplikáciu za 18 dní - a dosť sa dostala na #1 v obchode
Perspektíva
Toto je Alexander Embiricos - vedúci produktu pre OpenAI Codex - vysvetľujúci, prečo sa ich kódovací agent rozrástol 20-krát od augusta a prečo je vízia oveľa väčšia ako automatické dopĺňanie.
“Naozaj chytrý praktikant, ktorý odmietne čítať Slack.” Takto Alexander dnes popisuje Codex. Keď mu dáte správne pokyny, dokáže robiť úžasné veci, ale nekontroluje DataDog, pokiaľ ho neprosíte. Nezúčastňuje sa plánovania. Nevie, čo sa stalo na standupi. To je to, čo stavajú: tímového kolegu, nie nástroj.
Sora Android aplikácia bola vytvorená za 18 dní. Úplne nová aplikácia, potom za 10 dní neskôr (spolu 28 dní) bola sprístupnená. Toto je Codex urýchľujúci OpenAI interné. Codex je tiež na službe pre vlastné spustenia trénovania - píše infraštruktúrny kód, kontrola kódu zachytáva chyby v konfigurácii.
Kompresia umožňuje 24-hodinové spustenia agentov. Modely rutinne pracujú počas noci. Keď sa približujú k limitom kontextu, nová schopnosť nazývaná “kompresia” im umožňuje pripraviť stlačený kontext, reštartovať v novom okne a pokračovať. To vyžadovalo koordinovanú prácu na úrovni modelu, API a vrstvy harnesu.
Cloudový produkt bol príliš ďaleko v budúcnosti. Cloudový Codex sa spustil prvý - vzdialený počítač, na ktorý ste ho mohli delegovať masívne paralelne. Skvelé pre zamestnancov OpenAI zvyknutých na promptovanie s uvažovacími modelmi. Nie veľmi dobré pre všeobecné prijatie. Riešenie: najskôr sa dostanete k používateľom v IDE a CLI, potom ich postupne uvedieť k delegovaniu.
“Napísal som by som tento prompt? Možno 50/50.” To je dostatočné. Úloha agenta nie je byť dokonalý - je udržiavať konzistentnosť a bežať 24/7. Karpathyho prípad použitia: dajte mu vaše najznepokojujúcejšie chyby, nechajte ho bežať hodinu. Rieši problémy, ktoré nič iné nemôže.
Kľúčové poznatky
- 20x rast od augusta - Codex modely najčastejšie servírované v API
- Sora Android aplikácia za 18 dní - Dosahla #1 v obchode s aplikáciami za 28 dní
- Codex na pohotovosti pre vlastné trénovanie - Píše infraštruktúru, kontroluje kód
- Kompresia - Umožňuje 24-hodinové spustenia stlačením kontextu
- GPT 5.11 Codex Max - 30% rýchlejší na rovnakých úlohách, chytrejší pri vyšších úvahách
- Cloudový produkt príliš futuristický - Najskôr IDE/CLI, potom prejsť na delegovanie
- Proaktivita je poslaním - Tisíce užitočných momentov za deň, nie desiatky
- Prípad “najznepokojujúcejších chýb” - Karpathy dáva najťažšie problémy Codexu cez noc
- 50/50 prompty sú v poriadku - Konzistentnosť a 24/7 dostupnosť prebijú dokonalosť
- Signál interného testovania sa líši - Zamestnanci OpenAI príliš pohodlní s promptovaním s uvažovacími modelmi
Veľký obrázok
Codex sa nesnaží byť lepšie automatické dopĺňanie - snaží sa byť tímovým kolegom, ktorý pracuje, kým spíte. Posun od nástroja k kolegovi vyžaduje proaktivitu: tisíce užitočných momentov denne, nie desiatky. Keď je váš kódovací agent na pohotovosti pre vlastné spustenia trénovania, začala sa rekurzívna slučka AI zlepšujúcej AI.