GPT 5.2 深掘り:ナレッジワークはもう終わりだ

Peter Diamandis
gptopenaibenchmarksenterprisefuture-of-work

視点

このエピソードは、ベンチマーク分析に包まれた警告です。ほとんどのGPTリリースのカバレッジが厳選されたデモに焦点を当てている一方で、Diamandisとそのチームが掘り下げるのは、実際に重要なもの:GDP Valベンチマークです。

見出しの数字: ナレッジワークのタスクの71%は、現在、人間よりもAIによってより良く実行される - 11倍の速度で、コストは1%未満です。

これは段階的なシフトではありません。これはフェーズ遷移です。

この議論を価値のあるものにしているのは、これらの能力にもかかわらず採用がまだ遅い理由についての微妙なニュアンスです:

  • 言語ロック・イン:AIはPythonで優れていますが、レガシーJava/Cコードベースでは苦戦しています
  • 統合摩擦:企業は「メールシステムが接続されない」という段階に留まっていますが、コアの問題はすでに解決されています
  • 予測の失敗:人々は曲線を適切に外挿していません

パネルによるOpenAIが持つ3つのレバー(計算、安全性ノブ、ポストトレーニング)の分析は特に洞察的です。1つのリリースでARC AGI 2で17%から53%にジャンプするモデルを見ると、それは積極的なポストトレーニング - 競争がそれを要求するため、テストを教えています。

ビジュアル推論での年間390倍の効率改善は、単なるベンチマークの自慢ではありません。それはハイパーデフレーションがデータセンターからより広い経済に広がることのプレビューです。

主要なポイント

  • ナレッジワークの破壊は現在進行中 - GDP Valは11倍の速度で自動化されたタスクの71%を示し、<1%のコスト
  • 競争は現実的 - Google、OpenAI、Anthropic、XAIは、差別化された戦略で本物の競争を展開しています
  • 採用の障壁は解決可能 - 能力ではなく、レガシーコードと統合摩擦が障害です
  • 2026年の警告 - 「ビジネスの歴史における企業世界の最大の崩壊」の予測
  • ハイパーデフレーション拡大中 - 390倍の効率向上はベンチマークに限定されません

ビッグピクチャー

ナレッジワークのタスクの71%は、現在、人間よりも11倍の速度で、1%未満のコストでAIによってより良く実行されています。それは段階的なシフトではありません - それはフェーズ遷移です。障害は能力ではなく、統合です:レガシーコード、接続しないメールシステム。390倍の効率改善はベンチマークに限定されません。