Edwin Chen

Edwin Chen

Co-founder & CEO at Surge AI

Surge AI創設者。10億ドルの収益、70人、VCなし。すべてのフロンティアラボにトレーニングデータを提供。ベンチマークは「タブロイド購買者向けの最適化」と発言。

datatrainingenterprisestartup

Edwin Chenについて

Edwin ChenはSurge AIの共同創設者兼CEOで、すべてのフロンティアAIラボにトレーニングデータを提供するデータ企業です。同社は4年未満で約70人の従業員で10億ドル以上の収益に達し、完全に自己資本で、初日から利益を上げています。

キャリアハイライト

  • Surge AI (2020年-現在): 共同創設者兼CEO
  • 10億ドル以上の収益: 4年未満、約70人の従業員
  • 自己資本: VCの資金調達なし、初日から利益を上げている
  • 顧客: すべてのフロンティアAIラボがSurgeをトレーニングデータに使用
  • Quora/Twitter: 元MLエンジニア

注目すべき見解

なぜClaudeが優れているかについて

量ではなく、データの味:

“Why is Claude better at coding and writing? It’s not more data - it’s taste in what data to collect. Are you optimizing for front-end vs backend? Visual design vs efficiency? Chasing PR benchmarks or real-world performance? There’s an art to post-training that requires sophisticated judgment.”

「なぜClaudeはコーディングとライティングが優れているのか?より多くのデータではなく、収集するデータの味です。フロントエンド vs バックエンド向けに最適化していますか?視覚的デザイン vs 効率性?PR用ベンチマークを追いかけていますか、それとも実世界のパフォーマンスですか?ポストトレーニングには洗練された判断を要する芸術があります。」

ベンチマーク問題について

LM Arenaの残酷な批評:

“LM Arena benchmarks are literally optimizing your models for the type of people who buy tabloids at supermarkets. Users glance for 2 seconds and pick whatever looks ‘flashiest’ - more emojis, more bold text, longer responses. Models can hallucinate everything but still win if they look impressive.”

「LM Arenaベンチマークは文字通り、スーパーマーケットでタブロイドを買う人のタイプ向けにモデルを最適化しています。ユーザーは2秒見て、『派手』に見えるものを選びます - より多くの絵文字、より多くの太字、より長い応答。モデルはすべてを幻覚できますが、印象的に見えればまだ勝てます。」

より深い問題について

“We’re teaching AI to chase dopamine instead of truth. The same engagement optimization that broke social media is now being applied to AI training. Labs know it’s bad but optimize for it anyway because sales teams need PR.”

「真実の代わりにドーパミンを追いかけるようAIに教えています。ソーシャルメディアを壊したのと同じエンゲージメント最適化が、今AIトレーニングに適用されています。ラボはそれが悪いことを知っていますが、営業チームがPRを必要とするため、とにかく最適化します。」

主な引用

  • “量ではなく、データの味。”
  • “タブロイド購買者向けの最適化。”
  • “ドーパミンを追いかけるようAIに教えています。“

関連記事

Video Mentions

Video thumbnail

なぜClaudeが優れているか

なぜClaudeはコーディングとライティングが優れているのか?より多くのデータではなく、収集するデータの味です。フロントエンド vs バックエンド向けに最適化していますか?視覚的デザイン vs 効率性?PR用ベンチマークを追いかけていますか、それとも実世界のパフォーマンスですか?

Video thumbnail

ベンチマーク批評

LM Arenaベンチマークは文字通り、スーパーマーケットでタブロイドを買う人のタイプ向けにモデルを最適化しています。ユーザーは2秒見て、「派手」に見えるものを選びます - より多くの絵文字、より多くの太字、より長い応答。

Video thumbnail

ドーパミン vs 真実

真実の代わりにドーパミンを追いかけるようAIに教えています。ソーシャルメディアを壊したのと同じエンゲージメント最適化が、今AIトレーニングに適用されています。

Related People