Demis Hassabisが語るワールドモデル、AGIの欠落部分、そしてGenieが全てを変える理由
Google DeepMind CEOが、ワールドモデルがAGIに不可欠である理由、ぎこちない知能の問題、そしてシミュレーション世界で学習するGenieエージェントがいかにロボティクスを解き放つ可能性があるかについて議論
視点
これはDemis Hassabisが自分の領域で語る - Google DeepMindポッドキャスト(Hannah Fryとのインタビュー)で、AIが現在どこにあるのか、そしてAGIのためにどこに到達する必要があるのかについて語る。この会話は非常に技術的で、現在の制限について率直である。
「ぎこちない知能」という枠組みはなぜまだAGIを持っていないのかを理解するための鍵である。現在のモデルは国際数学オリンピックで金メダルを獲得しながら、基本的な論理パズルに失敗することができる。複雑な哲学を分析できるが、一貫性のあるチェスプレーに苦労している。Hassabisはこれを軽微なバグとして扱わない - これは基本的なアーキテクチャ上のギャップである。「AGIシステムであれば、あらゆる面で一貫性があることを期待するはずです。」
ワールドモデルはHassabisの最も長く続いている情熱であり、このインタビューはなぜ彼がこれが不可欠だと考えているのかを説明している。言語モデルは言語学者が予想するよりも世界についてより多くを理解している - 「言語は私たちが考えるより豊かである」 - しかし空間的ダイナミクス、直感的な物理学、感覚運動経験はテキストでは捉えることができない。ロボティクスと真の普遍的アシスタントのためには、物理空間での因果関係を理解するシステムが必要である。
Genie + Simmaループが本当のニュースだ。 彼らはAIエージェント(Simma)をAI生成ワールド(Genie)にドロップし、相互作用させている。「2つのAIは互いの心の中で相互作用しているようなものだ。」これは、Genieが生成することができるシナリオを生成できるシミュレーション環境の可能性として無限のトレーニング環境を生成する。これは具現化AIのトレーニングデータ問題への優雅なソリューションである。
幻覚について、Hassabisは微妙だが重要なポイントを出している:問題はモデルが不確実であることではなく、彼らが不確実であることを知らないということである。AlphaFoldは信頼スコアを出力する;LLMはしばしばそうしない。より良いモデルは「彼らが知っていることについてより多くを知る」ことができ、彼らの不確実性について内省できる。修正には、出力をダブルチェックするための思考ステップを使用する必要がある - システムが「停止し、一時停止し、彼らが言うところだったものを見直す」。
スケーリング議論はニュアンスのある扱いを受ける。 DeepMindは壁にぶつかっていない - Gemini 3は大きな改善を示している - しかし収益率はもう指数関数的ではない。「指数関数的と漸近線の間には多くの余地がある。」彼の公式:50%スケーリング、50%イノベーション。AGIにはその両方が必要である。
主要な結論
- ぎこちない知能はAGIのコア障壁 - モデルはPhDレベルのタスクで優れている一方、高校の論理に失敗する;ドメイン全体での一貫性が欠けている
- ワールドモデルは具現化AIに不可欠 - 空間的ダイナミクス、直感的な物理学、感覚運動経験はテキストからだけでは学習できない
- Genie + Simmaは無限のトレーニングループを作成 - AI生成ワールド内のAIエージェントがロボティクスのデータ問題を解決する可能性がある
- 幻覚はメタ無知に由来 - モデルは彼らが知らないことを知らない;AlphaFoldのような信頼スコアが必要
- スケーリングは死んでいない、ただ指数関数的ではない - DeepMindは50%スケーリング、50%イノベーションで動作;AGIにはその両方が必要
- 核融合はルートノード問題 - Commonwealth Fusionとのパートナーシップはプラズマ閉じ込めにおけるAI支援を通じてクリーンエネルギーを加速させる
- オンライン学習はまだ欠けている - 現在のモデルはデプロイ後に学習を続けない;これは重大なギャップである
- ワールドモデルには物理ベンチマークが必要 - 生成されたビデオはリアルに見えるが、ロボティクスに対して物理的に正確ではない
全体像
現在のAIは「ぎこちない」 - 狭いタスクで素晴らしいが、ドメイン全体で信頼できない。AGIへのパスは物理学と因果性を理解するワールドモデルを必要とする可能性が高い、言語パターンだけではない。DeepMindの賭け:AIが生成されたワールド内でエージェントを訓練してから、現実がどのように機能するかについての直感を発展させるまで。


