Mustafa SuleimanがAIエージェントの時代の到来について語る
視点
DeepMindの共同創業者で、「指数関数の平坦な部分」で10年を過ごした人物が、私たちが過小評価していると言う場合、注意を払う価値があります。
Mustafa Suleimanの中核的なテーゼは明確です。私たちはオペレーティングシステム、アプリ、ブラウザの世界から、エージェントとコンパニオンの世界へと移行している。すべてのユーザーインターフェースは最終的に、会話型のエージェント形式に取り込まれるでしょう。つまり、ポケットの中にあるすべてのコンテキストを持ち、何でもできる本当のアシスタントです。
この会話が価値あるものにしているのは、Suleimanの独特な視点です。DeepMindが「エアコンを最適化している」時代を過ごし、LLMが文中の単語を予測していた時期を経験しました。Googleで Lambda の動作を見たものの、それを提供することができませんでした。Inflection に15億ドルを調達しましたが、数ヶ月後にはオープンソースモデルが彼の資本全体を損なうのを目撃しました。
彼の「現代版チューリングテスト」の提案は、学術的なベンチマークを通り抜けて、極めてシンプルな指標に到達します。AIは10万ドルを100万ドルに変えることができるか? 自律型エージェントによる10倍のROI。彼は、これは今後数年以内に「実現可能な範囲内」だと予測しています。
最も驚くべき認めは何か?推論コストの激減です。彼はAIは何年も高額であると予想していました。代わりに、2年間で100倍のコスト削減を手にし、何十億ドルもの価値があるオープンソースモデルが無料で公開されました。「その部分は本当に間違っていました。」
科学への AI については、彼はより慎重です。新規発見のための訓練データが少なく、人間参加ループの実装が難しいため、経済タスクよりも難しいのです。しかし、論理的推論(数学/コーディングの訓練から)と創造的な補間の組み合わせは、科学的進歩のための「極めて危険な組み合わせ」です。
重要なポイント
- アプリからエージェントへ - 根本的な転換は、ユーザーインターフェースから、すべての現在のソフトウェアパラダイムを取り込むAIエージェントへのものです
- 現代版チューリングテスト - 学術的なベンチマークよりも経済的なベンチマークが重要です。AIはあなたの投資を10倍にできるか?
- 2027年のタイムライン - 経済的なベンチマークに合格するエージェントは、今後数年以内に「実現可能な範囲内」です
- Microsoftの賭け - ベンチマークで競争することではなく、エンタープライズAIの信頼できる、安定したプラットフォームであることが戦略です
- オープンソースショック - 何十億ドルもの価値があるモデルが無料で公開され、競争環境は完全に変わりました
- 科学はより難しい - 新規発見のためのAIは、ビジネスタスクの訓練データと人間参加ループのメカニクスに欠けています
大きな視点
私たちはオペレーティングシステムとアプリからエージェントとコンパニオンへと移行しています。すべてのユーザーインターフェースは最終的には会話型になるでしょう。「現代版チューリングテスト」(AIは10万ドルを100万ドルに変えることができるか?)は学術的なベンチマークを通り抜けて、重要なことを問います。DeepMindの共同創業者は、2027年までにこれに合格すると考えています。