Responsable OpenAI Codex : Nous avons construit l'application Android Sora en 18 jours - Et elle est #1 dans le Store
Perspective
Voici Alexander Embiricos - responsable produit pour OpenAI Codex - qui explique pourquoi leur agent de codage a connu une croissance de 20x depuis août et pourquoi la vision va bien au-delà de l’autocomplétion.
“Un stagiaire vraiment intelligent qui refuse de lire Slack.” C’est ainsi qu’Alexander décrit Codex aujourd’hui. Il peut faire des choses incroyables quand vous lui donnez des directives appropriées, mais il ne vérifie pas DataDog à moins que vous ne le demandiez. Il ne participe pas à la planification. Il ne sait pas ce qui s’est passé lors du standup. C’est ce vers quoi ils construisent : un coéquipier, pas un outil.
L’application Android Sora a été construite en 18 jours. Une toute nouvelle application, puis 10 jours plus tard (28 jours au total), elle est devenue publique. C’est Codex qui accélère OpenAI en interne. Codex est également de garde pour ses propres exécutions d’entraînement - écrivant du code d’infrastructure, la revue de code détectant les erreurs de configuration.
La compaction permet des exécutions d’agents de 24 heures. Les modèles travaillent maintenant régulièrement toute la nuit. Lorsqu’ils approchent des limites de contexte, une nouvelle capacité appelée “compaction” leur permet de préparer un contexte compressé, de redémarrer dans une fenêtre fraîche et de continuer. Cela a nécessité un travail coordonné entre les couches modèle, API et harnais.
Le produit cloud était trop loin dans le futur. Codex cloud a été lancé en premier - un ordinateur distant auquel vous pouviez déléguer massivement en parallèle. Excellent pour les employés d’OpenAI habitués au prompting de modèle de raisonnement. Pas génial pour l’adoption générale. Le déblocage : atterrir d’abord avec les utilisateurs dans l’IDE et le CLI, puis les faire progresser vers la délégation au fil du temps.
“Aurais-je écrit ce prompt ? Peut-être 50/50.” C’est assez bon. Le travail de l’agent n’est pas d’être parfait - c’est de maintenir la cohérence et de fonctionner 24h/24 et 7j/7. Le cas d’usage de Karpathy : donnez-lui vos bugs les plus complexes, laissez-le tourner pendant une heure. Il résout des problèmes que rien d’autre ne peut résoudre.
Points clés
- Croissance de 20x depuis août - Modèles Codex les plus servis dans l’API
- Application Android Sora en 18 jours - #1 dans l’app store à 28 jours
- Codex de garde pour son propre entraînement - Écrit l’infrastructure, révise le code
- Compaction - Permet des exécutions de 24 heures en compressant le contexte
- GPT 5.11 Codex Max - 30% plus rapide pour les mêmes tâches, plus intelligent avec un raisonnement supérieur
- Produit cloud trop futuriste - IDE/CLI d’abord, puis progression vers la délégation
- La proactivité est la mission - Des milliers de moments utiles par jour, pas des dizaines
- Cas d’usage “bugs les plus complexes” - Karpathy donne les problèmes les plus difficiles à Codex pendant la nuit
- Les prompts 50/50 sont acceptables - La cohérence et la disponibilité 24/7 battent la perfection
- Le signal de dogfooding diffère - Les employés d’OpenAI trop à l’aise avec les prompts de raisonnement
Vue d’ensemble
Codex n’essaie pas d’être une meilleure autocomplétion - il essaie d’être un coéquipier qui travaille pendant que vous dormez. Le passage d’outil à collègue nécessite de la proactivité : des milliers de moments utiles quotidiennement, pas des dizaines. Lorsque votre agent de codage est de garde pour ses propres exécutions d’entraînement, la boucle récursive de l’IA améliorant l’IA a commencé.