Newsfeed / People / Nathan Lambert
Nathan Lambert

Nathan Lambert

Senior Research Scientist & Post-Training Lead

Allen Institute for AI (AI2)

researchopen-sourcerlhfpost-training

Nathan Lambertについて

Nathan Lambertは、Allen Institute for AI(AI2)のシニアリサーチサイエンティスト兼ポストトレーニングリーダーであり、言語モデルの完全にオープンなポストトレーニングパイプラインとして数少ないTULUの開発をリードしている。また、人間のフィードバックからの強化学習に関する決定版であるThe RLHF Bookの著者であり、Interconnects AIニュースレターの創設者でもある。

AI2以前は、Hugging FaceでRLHF研究チームを構築し、広く使用されているDiffusersライブラリに強化学習の統合を貢献した。UC Berkeleyで博士号を取得し、ロボティクス、モデルベース強化学習、制御の交差領域で研究を行い、Facebook AIとDeepMindでインターンシップを経験した。

Lambertは米国におけるオープンソースAI開発の最も積極的な擁護者の一人であり、クローズドモデルとオープンモデルの競争力学、中国のオープンウェイトリリースの戦略的意味合いについて定期的に執筆している。

キャリアハイライト

  • AI2 シニアリサーチサイエンティスト&ポストトレーニングリーダー(現職)
  • TULUポストトレーニングパイプライン開発をリード(LlamaおよびOLMoモデルに適用)
  • 元Hugging Face RLHF研究チームリーダー
  • The RLHF Book著者
  • UC Berkeley電気工学・コンピュータサイエンス博士号
  • Facebook AI ResearchおよびDeepMindでのインターンシップ
  • Interconnects AIニュースレター創設者

注目すべき見解

Anthropicの文化的優位性について

LambertはAnthropicのClaude Codeの成功を、技術的なものだけでなく文化的な現象と見ている。同社は主要ラボの中で「最も混乱が少ない」印象を与えており、コードツールへの賭けがマーケティングでは再現できないコミュニティの自然発生的な熱狂を生み出した。

事前学習とポストトレーニングについて

「事前学習は終わった」という論調に反論し、計算資源の大部分はまだ事前学習に投入されており、ベースモデルの品質が飽和するまでそれは続くと主張する。その時点でRLの計算時間が単純に長くなるだけだ。2026年に2,000ドルのサブスクリプション価格帯が登場すると予想している。

中国のオープンウェイト戦略について

中国企業は自分たちの立場を現実的に見ていると説明する:セキュリティ上の懸念から欧米企業は中国のAPIサブスクリプションに支払わないため、オープンウェイトモデルはグローバルな影響力と市場アクセスのための戦略的な動きだ。2026年には2025年よりも多くのオープンモデルビルダーが現れ、その多くが中国からになると予想している。

Googleの構造的優位性について

Googleはすべてをトップからボトムまで自社開発しており(カスタムTPU、データセンター)、Nvidiaの「異常な」マージンを支払わないため、AI基盤において歴史的な優位性を持つと主張する -- スケールに応じて複利的に効く費用面での優位性だ。

主要な引用

  • "The hype over Anthropic's Claude Opus 4.5 model has been absolutely insane... culturally Anthropic is known for betting very hard on code."(AnthropicのClaude Opus 4.5モデルへの熱狂は完全に異常です...文化的にAnthropicはコードに全力で賭けることで知られています。) -- Anthropicについて
  • "I still think most of the compute is going in at pre-training because you can still make a model better."(計算資源の大部分はまだ事前学習に投入されていると思います。なぜならモデルをまだ改善できるからです。) -- スケーリングについて
  • "US models are currently better and we use them... I try Chinese models and I'm like, fun, but I don't go back to it."(米国のモデルの方が現在は優れていて、私たちはそれを使っています...中国のモデルを試すと、面白いけど、戻ることはありません。) -- モデルの品質について

関連トピック

Video Appearances

AIの現状とオープンモデル

AIの現状とオープンモデル

AnthropicのClaude Opus 4.5への熱狂、中国のオープンウェイト競争、Googleのインフラ優位性がAI競争を左右する可能性について議論。AI2でTULUポストトレーニングをリード。

at 00:05:00

Related People