Edwin Chen

Edwin Chen

Co-founder & CEO at Surge AI

Zakladateľ Surge AI. $1B príjmov, 70 ľudí, žiadne VC. Poskytuje tréningové dáta každému frontiernému labu. Hovorí, že benchmarky sú 'optimalizácia pre kupujúcich bulváru.'

datatrainingenterprisestartup

O Edwinovi Chenovi

Edwin Chen je spoluzakladateľ a CEO Surge AI, dátovej spoločnosti, ktorá poskytuje tréningové dáta každému frontiernovému AI labu. Spoločnosť dosiahla $1B+ príjmov za menej ako 4 roky s ~70 zamestnancami, úplne bootstrap a zisková od prvého dňa.

Kariérne úspechy

  • Surge AI (2020-súčasnosť): Spoluzakladateľ a CEO
  • $1B+ príjmov: Za menej ako 4 roky, ~70 zamestnancov
  • Bootstrap: Žiadne VC financovanie, ziskový od prvého dňa
  • Klienti: Každý frontierový AI lab používa Surge pre tréningové dáta
  • Quora/Twitter: Bývalý ML inžinier

Významné pozície

Prečo je Claude lepší

Vkus v dátach, nie objem:

“Why is Claude better at coding and writing? It’s not more data - it’s taste in what data to collect. Are you optimizing for front-end vs backend? Visual design vs efficiency? Chasing PR benchmarks or real-world performance? There’s an art to post-training that requires sophisticated judgment.”

Prečo je Claude lepší v kódovaní a písaní? Nie je to viac dát - je to vkus v tom, aké dáta zbierať. Optimalizujete pre front-end vs backend? Vizuálny dizajn vs efektivitu? Naháňate PR benchmarky alebo reálny výkon? Existuje umenie post-trainingu, ktoré vyžaduje sofistikované úsudky.

O problémoch benchmarkov

Brutálna kritika LM Arena:

“LM Arena benchmarks are literally optimizing your models for the type of people who buy tabloids at supermarkets. Users glance for 2 seconds and pick whatever looks ‘flashiest’ - more emojis, more bold text, longer responses. Models can hallucinate everything but still win if they look impressive.”

LM Arena benchmarky doslova optimalizujú vaše modely pre typ ľudí, ktorí kupujú bulvár v supermarketoch. Používatelia sa pozrú na 2 sekundy a vyberú si čokoľvek, čo vyzerá ‘najžiarivejšie’ - viac emoji, viac tučného textu, dlhšie odpovede. Modely môžu halucínovať všetko, ale stále vyhrávajú, ak vyzerajú impresívne.

O hlbšom probléme

“We’re teaching AI to chase dopamine instead of truth. The same engagement optimization that broke social media is now being applied to AI training. Labs know it’s bad but optimize for it anyway because sales teams need PR.”

Učíme AI naháňať dopamín namiesto pravdy. Tá istá optimalizácia engagementu, ktorá zlomila sociálne médiá, sa teraz aplikuje na AI tréning. Laby vedia, že je to zlé, ale aj tak to optimalizujú, pretože predajné tímy potrebujú PR.

Kľúčové citáty

  • “Vkus v dátach, nie objem.”
  • “Optimalizácia pre kupujúcich bulváru.”
  • “Učíme AI naháňať dopamín.”

Súvisiace čítanie

Video Mentions

Video thumbnail

Prečo je Claude lepší

Why is Claude better at coding and writing? It's not more data - it's taste in what data to collect. Are you optimizing for front-end vs backend? Visual design vs efficiency? Chasing PR benchmarks or real-world performance?

Video thumbnail

Kritika benchmarkov

LM Arena benchmarks are literally optimizing your models for the type of people who buy tabloids at supermarkets. Users glance for 2 seconds and pick whatever looks 'flashiest' - more emojis, more bold text, longer responses.

Video thumbnail

Dopamín vs pravda

We're teaching AI to chase dopamine instead of truth. The same engagement optimization that broke social media is now being applied to AI training.

Related People