穆斯塔法·苏莱曼:从空调到AGI——在指数曲线的平缓段走过的十年

agentsinterviewenterprisefuture-of-workclaude

视角

穆斯塔法·苏莱曼对AI发展轨迹提供了独特而扎根于现实的视角。他在DeepMind度过了十年,这段时间他称之为”指数曲线的平缓段”——尽管革命性的论文不断涌现,但商业应用仍然遥不可及。他揭露谷歌以6.5亿美元收购DeepMind最初是为了优化数据中心空调的事实,深刻说明了变革性技术如何悄悄地改变世界。

对话中最引人注目的时刻是当苏莱曼承认自己的错误判断:他低估了开源模型的民主化和推理成本的大幅下跌。当Inflection AI筹集15亿美元来构建最大的H100集群之一时,Llama的出现和易于访问的API在一夜之间彻底改变了竞争格局。这样的谦虚来自一个准确预测了缩放法则轨迹的人,因此更增加了他其他预测的可信度。

他提出的”现代图灵测试”——通过衡量AI代理是否能将10万美元转化为100万美元来评估AI能力——摆脱了学术基准测试的虚伪,直指真正重要的东西。苏莱曼认为我们会在2年内(到2027年)看到代理通过这个测试,同时也承认AI在科学领域需要更长时间,因为新的发现缺乏训练数据和商业任务中存在的人机协作机会。

主要收获

  • 微软的战略论点:从操作系统、搜索引擎和应用程序向AI代理和伴侣的转变是决定性的范式转变——微软正在围绕这一转变调整所有25万名员工的工作
  • “现代图灵测试”衡量经济能力:AI代理能否将10万美元的投资增加10倍?苏莱曼预测这将在2年内实现
  • AI推理成本在两年内下降了100到1000倍——这是苏莱曼承认自己完全没有预测到的速度,特别是开源模型的影响
  • 谷歌的Lambda时刻是苏莱曼最近一次”思想被颠覆”的经历——看到对话AI的出现让他意识到范式已经改变,谷歌未能推出它导致了大批人才流失,催生了Character AI、Adept和Inflection

大局观

这位在DeepMind度过了十年”指数曲线平缓段”的人物现在领导微软的AI战略。他提出的现代图灵测试——代理能否将10万美元转化为100万美元?——摆脱了基准测试的表面文章,直指问题的本质。他认为我们会在2027年前通过这个测试。