穆斯塔法·苏莱曼谈人工智能代理的时代来临

Moonshots
agentsmicrosoftinterviewenterprisefuture-of-work

观点

当一位在”指数平坦期”待了十年的DeepMind共同创始人告诉你我们反应不足时,这值得认真对待。

穆斯塔法·苏莱曼的核心论点很清楚:我们正在从操作系统、应用程序和浏览器的世界过渡到代理和伴侣的世界。每个用户界面最终都将被转换为对话式代理形式——一个真正的助手,随时掌握你的所有信息,能做任何事情。

这场对话之所以有价值,是因为苏莱曼拥有独特的视角。他经历了DeepMind”优化空调”的岁月和LLM预测句子中单个单词的时代。他看到Lambda在谷歌工作但无法发布。他为Inflection筹集了15亿美元,随后又看着开源模型在几个月后摧毁了他整个资本基础。

他的”现代图灵测试”提案用一个粗暴简单的指标超越了学术基准:人工智能能否将10万美元变成100万美元? 自主代理的10倍投资回报率。他预测这在未来几年内是”可达到的”。

最令人惊讶的承认是什么?推理成本的急剧下降。他预计人工智能会在多年内保持昂贵。结果我们在两年内获得了100倍的成本降低,价值数十亿美元的开源模型被免费发布。“这一点我完全搞错了。”

在科学人工智能方面,他更加谨慎——这比经济任务更难,因为新发现的训练数据较少,人工干预的实现也更困难。但逻辑推理(来自数学/编码训练)与创意插值的结合对科学进步来说是”致命的组合”。

主要要点

  • 应用到代理 - 根本的转变是从用户界面到人工智能代理,后者包含了所有当前的软件范式
  • 现代图灵测试 - 经济基准比学术基准更重要:AI能否使你的投资增长10倍?
  • 2027年时间表 - 通过经济基准的代理在未来几年内是”可达到的”
  • 微软的赌注 - 作为企业人工智能的可信赖、稳定平台是战略,而不是在基准上竞速
  • 开源冲击 - 价值数十亿美元的模型被免费发布,完全改变了竞争格局
  • 科学更难 - 用于新发现的人工智能缺乏企业任务的训练数据和人工干预机制

大局

我们正在从操作系统和应用程序向代理和伴侣过渡。每个用户界面最终都将是对话式的。“现代图灵测试”——人工智能能否将10万美元变成100万美元?——超越学术基准,询问真正重要的事情。一位DeepMind共同创始人认为我们将在2027年之前通过它。