Edwin Chen

Co-founder & CEO at Surge AI

Zakladateľ Surge AI. $1B príjmov, 70 ľudí, žiadne VC. Poskytuje tréningové dáta každému frontiernému labu. Hovorí, že benchmarky sú 'optimalizácia pre kupujúcich bulváru.'

@echen LinkedIn

datatrainingenterprisestartup

O Edwinovi Chenovi

Edwin Chen je spoluzakladateľ a CEO Surge AI, dátovej spoločnosti, ktorá poskytuje tréningové dáta každému frontiernovému AI labu. Spoločnosť dosiahla $1B+ príjmov za menej ako 4 roky s ~70 zamestnancami, úplne bootstrap a zisková od prvého dňa.

Kariérne úspechy

Surge AI (2020-súčasnosť): Spoluzakladateľ a CEO
$1B+ príjmov: Za menej ako 4 roky, ~70 zamestnancov
Bootstrap: Žiadne VC financovanie, ziskový od prvého dňa
Klienti: Každý frontierový AI lab používa Surge pre tréningové dáta
Quora/Twitter: Bývalý ML inžinier

Významné pozície

Prečo je Claude lepší

Vkus v dátach, nie objem:

“Why is Claude better at coding and writing? It’s not more data - it’s taste in what data to collect. Are you optimizing for front-end vs backend? Visual design vs efficiency? Chasing PR benchmarks or real-world performance? There’s an art to post-training that requires sophisticated judgment.”

Prečo je Claude lepší v kódovaní a písaní? Nie je to viac dát - je to vkus v tom, aké dáta zbierať. Optimalizujete pre front-end vs backend? Vizuálny dizajn vs efektivitu? Naháňate PR benchmarky alebo reálny výkon? Existuje umenie post-trainingu, ktoré vyžaduje sofistikované úsudky.

O problémoch benchmarkov

Brutálna kritika LM Arena:

“LM Arena benchmarks are literally optimizing your models for the type of people who buy tabloids at supermarkets. Users glance for 2 seconds and pick whatever looks ‘flashiest’ - more emojis, more bold text, longer responses. Models can hallucinate everything but still win if they look impressive.”

LM Arena benchmarky doslova optimalizujú vaše modely pre typ ľudí, ktorí kupujú bulvár v supermarketoch. Používatelia sa pozrú na 2 sekundy a vyberú si čokoľvek, čo vyzerá ‘najžiarivejšie’ - viac emoji, viac tučného textu, dlhšie odpovede. Modely môžu halucínovať všetko, ale stále vyhrávajú, ak vyzerajú impresívne.

O hlbšom probléme

“We’re teaching AI to chase dopamine instead of truth. The same engagement optimization that broke social media is now being applied to AI training. Labs know it’s bad but optimize for it anyway because sales teams need PR.”

Učíme AI naháňať dopamín namiesto pravdy. Tá istá optimalizácia engagementu, ktorá zlomila sociálne médiá, sa teraz aplikuje na AI tréning. Laby vedia, že je to zlé, ale aj tak to optimalizujú, pretože predajné tímy potrebujú PR.

Kľúčové citáty

“Vkus v dátach, nie objem.”
“Optimalizácia pre kupujúcich bulváru.”
“Učíme AI naháňať dopamín.”

Súvisiace čítanie

Scaling Laws - Čo dáta Surge umožňujú
Dario Amodei - CEO Anthropic, klient Surge

Video Mentions

Prečo je Claude lepší

Why is Claude better at coding and writing? It's not more data - it's taste in what data to collect. Are you optimizing for front-end vs backend? Visual design vs efficiency? Chasing PR benchmarks or real-world performance?

Kritika benchmarkov

LM Arena benchmarks are literally optimizing your models for the type of people who buy tabloids at supermarkets. Users glance for 2 seconds and pick whatever looks 'flashiest' - more emojis, more bold text, longer responses.

Dopamín vs pravda

We're teaching AI to chase dopamine instead of truth. The same engagement optimization that broke social media is now being applied to AI training.

Related People

dario amodei