OpenAI Codex主管:我们用18天构建了Sora安卓应用——并登顶商城第一名

Lenny's Podcast
interviewdeveloper-toolsagentsgpt

观点

这是OpenAI Codex产品负责人Alexander Embiricos的分享——解释为什么他们的编码智能体自8月以来增长了20倍,以及为什么这个愿景远大于自动补全。

“一个拒绝看Slack的真正聪明的实习生。” 这是Alexander对Codex现状的描述。当你给它适当的指导时,它能做令人惊人的事情,但除非你要求,它不会检查DataDog。它不会参与计划。它不知道站会上发生了什么。这就是他们正在构建的方向:一个队友,而不是工具。

Sora安卓应用在18天内完成。 一个全新的应用,然后10天后(总共28天)公开发布。这是Codex在加速OpenAI内部的开发。Codex还值班参与自己的训练运行——编写基础设施代码、代码审查捕捉配置错误。

压缩机制支持24小时智能体运行。 模型现在经常整夜工作。当接近上下文限制时,一个名为”压缩”的新功能让它们能够准备压缩上下文、在新窗口中重启并继续。这需要在模型、API和框架层进行协调工作。

云产品面向未来太远。 Codex Cloud首先推出——一个可以大规模并行委派的远程计算机。对习惯了推理模型提示的OpenAI员工很好用。对普遍采用来说不够好。解决方案:先在IDE和CLI中接触用户,然后逐步让他们升级到委派模式。

“我会写这个提示吗?也许50/50。” 这就足够好了。智能体的工作不是完美——而是保持一致性和全天候运行。Karpathy的用例:给它你最复杂的bug,让它运行一小时。它解决其他任何东西都无法解决的问题。

关键要点

  • 自8月以来增长20倍 - Codex是API中使用最多的模型
  • 18天完成Sora安卓应用 - 28天时登顶应用商城
  • Codex值班参与自己的训练 - 编写基础设施、审查代码
  • 压缩机制 - 通过压缩上下文实现24小时运行
  • GPT 5.11 Codex Max - 同样任务速度快30%,推理能力更强
  • 云产品过于超前 - IDE/CLI优先,然后升级到委派
  • 主动性是终极使命 - 每天数千个有帮助的时刻,而不是十几个
  • “最复杂的bug”用例 - Karpathy把最难的问题交给Codex在夜间处理
  • 50/50提示也可以 - 一致性和全天候可用性胜过完美
  • Dogfooding信号不同 - OpenAI员工过于习惯推理提示

大局观

Codex不是试图成为更好的自动补全——它试图成为一个在你睡眠时也能工作的队友。从工具到同事的转变需要主动性:每天数千个有帮助的时刻,而不是十几个。当你的编码智能体值班参与自己的训练运行时,AI改进AI的递归循环已经开始。