Vedoucí OpenAI Codex: Postavili jsme aplikaci Sora pro Android za 18 dní - a dostala se na #1 v obchodě

Lenny's Podcast
interviewdeveloper-toolsagentsgpt

Perspektiva

Toto je Alexander Embiricos - vedoucí produktu OpenAI Codex - vysvětlující, proč jejich agentní systém pro kódování vzrostl 20krát od srpna a proč je vize mnohem větší než pouze automatické doplňování kódu.

“Opravdu chytrý praktikant, který odmítá číst Slack.” Takto Alexander popisuje Codex dnes. Může dělat úžasné věci, když mu dáte správný pokyn, ale nekontroluje DataDog, pokud jej o to nepožádáte. Neúčastní se plánování. Neví, co se stalo na standupu. To je to, co stavěli: spolupracovníka, ne nástroj.

Aplikace Sora Android byla vytvořena za 18 dní. Úplně nová aplikace, pak po 10 dnech (celkem 28 dní) byla zveřejněna. Tímto způsobem Codex zrychluje OpenAI interně. Codex také bedlivě dohlíží na své vlastní tréninky - píše infrastrukturní kód, kontroluje kód a chytá chyby v konfiguraci.

Komprese umožňuje 24hodinové běhy agentů. Modely nyní rutinně pracují přes noc. Když se blíží limitům kontextu, nová schopnost zvaná “komprese” jim umožní připravit komprimovaný kontext, restartovat v novém okně a pokračovat. To vyžadovalo koordinovanou práci přes vrstvy modelů, API a harnesu.

Cloudový produkt byl příliš daleko v budoucnosti. Codex cloud se spustil jako první - vzdálený počítač, kterému jste mohli masivně delegovat paralelně. Skvělé pro zaměstnance OpenAI zvyklé na promptování modelů s uvažováním. Není to ideální pro všeobecné přijetí. Klíč k odemknutí: začněte s uživateli v IDE a CLI, pak je postupně přesuňte na delegování.

“Napsal bych tento prompt? Možná 50/50.” To je dost dobré. Práce agenta není být dokonalý - je to udržovat konzistenci a běžet 24/7. Případová studie Karpatyho: dejte mu vaše nejobtížnější chyby, nechte ho běžet hodinu. Řeší problémy, které nic jiného nemůže.

Klíčové poznatky

  • 20násobný růst od srpna - modely Codex služby nejčastěji používané v API
  • Aplikace Sora Android za 18 dní - dostala se na #1 v obchodě za 28 dní
  • Codex hlídá svůj vlastní trénink - píše infrastrukturu, kontroluje kód
  • Komprese - umožňuje 24hodinové běhy kompresí kontextu
  • GPT 5.11 Codex Max - 30% rychlejší na stejných úkolech, chytřejší při vyšším uvažování
  • Cloudový produkt příliš futuristický - nejprve IDE/CLI, poté přechod na delegování
  • Proaktivita je podstatou mise - tisíce užitečných momentů denně, ne jen desítky
  • Použití “nejobtížnějších chyb” - Karpathy dává nejtěžší problémy Codexu v noci
  • 50/50 prompty jsou v pořádku - konzistence a 24/7 dostupnost porážejí dokonalost
  • Signál dogfoodingu se liší - zaměstnanci OpenAI příliš obeznámeni s prompty pro modely s uvažováním

Širší pohled

Codex se nesnaží být lepší automatické doplňování - snaží se být spolupracovníkem, který pracuje, když spíte. Přechod z nástroje na kolegu vyžaduje proaktivitu: tisíce užitečných momentů denně, ne jen desítky. Když je váš agentní systém pro kódování na hlídce pro své vlastní tréninky, začala rekurzivní smyčka AI zlepšující AI.