Sam Altman:74%的知识工作任务现已被AI匹配
OpenAI的CEO透露GPT 5.2在40多个商业任务中有74%超过人类专家,并解释为什么记忆将是AI的终极护城河。
Altman如何看待AI改变知识工作
这次与Sam Altman的广泛访谈提供了迄今为止AI对知识工作影响的最具体基准之一。OpenAI的内部评估——GPD-val——在包括法律分析、PowerPoint创建、网页应用等40多个商业垂直领域测试AI。结果令人震惊:GPT 5.2 Pro现在在74.1%的这些任务上超过或平齐人类专家。
关于知识工作基准: "A coworker that you can assign an hour's worth of tasks to and get something you like better back 74 or 70% of time... if you went back to the launch of ChatGPT 3 years ago and said we were going to have that in 3 years, most people would say absolutely not."(一个你可以分配一小时任务、74%或70%的时间能得到你更喜欢的结果的同事...如果你回到3年前ChatGPT发布时说我们会在3年内有这个,大多数人会说绝对不可能。)这不是合成基准——而是企业专家在真实商业任务中判断他们是否更喜欢AI输出而非同行输出。
关于为什么ChatGPT在3年里几乎没变: "I expected by this point ChatGPT would have looked more different than it did at launch... There is something about the generality of the current interface that I underestimated the power of."(我预计到这个时候ChatGPT看起来会比发布时更不同...当前界面的通用性有我低估的力量。)这个"甚至不是有意设计成产品"的简单聊天界面比所有关于需要更复杂UX的预测都要持久。
关于未来的工作界面: "I would rather just sort of like have the ability to say in the morning, here are the things I want to get done today... Deal with everything you can. You know me. You know these people."(我宁愿早上能够说,这是我今天想完成的事情...处理你能处理的一切。你了解我。你了解这些人。)Altman设想超越消息摘要,进入真正的代理委托——AI处理一切可能的事情,每隔几小时批量更新。
关于成为AI CEO: "I think a lot about how we can automate all the functions at OpenAI and then even more than that I think about like what it means to have an AI CEO of OpenAI. Doesn't bother me. I'm thrilled for it."(我经常思考我们如何能自动化OpenAI的所有职能,甚至更多地思考有一个AI CEO对OpenAI意味着什么。这不会困扰我。我为此感到兴奋。)他的条件:人类仍然在治理AI高管的"董事会"中。
关于记忆成为护城河: "We're in the GPT-2 era of memory. But what it's going to be like when it really does remember every detail of your entire life... the little small preferences that you had that you maybe didn't even think to indicate."(我们处于记忆的GPT-2时代。但当它真的记住你整个生活的每一个细节时会是什么样子...你甚至可能没想过要表明的那些小偏好。)完美的终身记忆是没有人类助手能够提供的东西。
Sam Altman关于企业AI的6个洞见
- GPT 5.2在74%的知识工作上匹配专家 - 在40多个商业任务类别中,包括法律、金融和创意工作,专家现在大多数时候更喜欢AI输出
- 应用问题,而不是训练问题 - 限制因素不是模型智能,而是构建从现有能力中提取价值的应用
- 今年企业增长比消费者更快 - API业务超过了ChatGPT的增长,标志着B2B拐点已经到来
- 记忆将是终极护城河 - 当前的记忆是"GPT-2时代的粗糙",但终身完美记忆将创造前所未有的粘性
- AI CEO即将到来 - Altman积极思考自动化他自己的角色,前提是人类治理保持到位
- 2026年第一季度将有新模型 - 预期比5.2有显著提升,消费者关注非IQ改进,企业关注更多智能
74%基准对组织意味着什么
74%的知识工作基准不仅仅是一个数字——它是一个门槛。当AI输出在大多数商业任务中超过人类专家输出时,问题从"AI能做这个吗?"转变为"为什么AI不在做这个?"Altman坦率地承认他会欢迎一个AI CEO,反映了一种世界观,在这种世界观中,人类比较优势不在于任务执行,而在于治理、创造力和选择解决什么问题。对组织而言,含义很清楚:工具已经准备好了,瓶颈现在是组织采用。


