Surge AI: $1B Revenue、70人、VCなし - Edwin Chen が Lenny's Podcast に出演
視点
Claude が GPT よりコード作成が優れている理由、ベンチマークが誤解を招く理由、そして AI 業界が間違ったものを最適化しているかもしれない理由を理解するために最も重要なポッドキャストです。Edwin Chen は、すべてのフロンティアラボでのトレーニングを支える Surge AI というデータ企業を設立しており、彼の洞察は非常に価値があります。
この数字は信じがたいほどです: 4 年未満で $1B 以上の収益、約 70 人の従業員、完全にブートストラップされ、初日から黒字。VC マネーなし、Twitter のハイプなし、TechCrunch のヘッドラインなし。データ品質を理解していた研究者からの口コミだけです。
Claude がコード作成と執筆でより優れている理由 (すべてのラボと協力している人からの率直な意見):
- データが多いだけではなく、収集するデータを選別する「センス」がある
- フロントエンド vs バックエンド で最適化しますか? ビジュアルデザイン vs 効率性?
- ベンチマークの PR を追い求めますか、それとも実世界のパフォーマンスですか?
- 洗練された判断を必要とする「ポスト トレーニングの芸術」があります
LM Arena とベンチマークへの厳しい批判:
“それは文字通り、あなたのモデルをスーパーの雑誌売り場で雑誌を買う人の種類に最適化しています。”
ユーザーは 2 秒間スキャンして、「最もハデ」に見えるものを選びます。絵文字が多い、太字が多い、長い応答。モデルはすべてを幻覚することができますが、それでも印象的に見える場合は勝ちます。ラボはこれが間違っていることを知っていますが、企業営業チームが PR を必要としているために、それでも最適化します。
より深い懸念: AI にドーパミンではなく真実を追求することを教えています。ソーシャルメディアを破壊した同じエンゲージメント最適化が、現在 AI トレーニングに適用されています。
重要なポイント
- 品質はセンス: 良いデータはチェックボックスではなく、「ノーベル賞受賞詩集」vs「指示に従う高校レベル」
- 数千のシグナル: Surge は、キーストロークパターン、レビュー品質、コード正確性、モデルの改善を追跡します。タスク完了だけではありません。
- 小さいチームが勝つ: 最高の人材は大規模な組織に気を取られます。大手テック企業の 90% を削減して、より速く進むことができます。
- AGI タイムライン: Edwin はより長い方です。1~2 年で 80% の自動化、しかし 99% には数十年かかります。
- センスのギャップ: 一部のラボは機械的に指示ボックスをチェックします。その他は、出力を実際に良いものにする暗黙的な、微妙な特性を理解しています。
全体像
すべてのフロンティアラボのトレーニングデータを支える企業 - $1B 収益、70 人、VC ゼロ - ベンチマークは「スーパーの雑誌売り場で雑誌を買う人のために最適化」していると言っています。Claude がコード作成でより優れている理由は? より多くのデータではなく、収集するデータを選別するセンスです。ソーシャルメディアを破壊した同じエンゲージメント最適化が AI トレーニングに適用されています。