John Schulman: ChatGPT sa mohol postaviť v roku 2018
Spoluzakladateľ OpenAI odhaľuje, že skoré OpenAI bolo 'rag tag ako akademická skupina' a prečo dobré myšlienky zlyhávajú, keď chýbajú predpoklady.
Perspektíva
John Schulman spoluzakladal OpenAI, vytvoril PPO (algoritmus za RLHF) a nedávno odišiel založiť Thinking Machines. Tento vzácny rozhovor ponúka insiderský pohľad na to, ako frontier AI výskum skutočne funguje: falošné štarty, organizačná kultúra, výskumný vkus, ktorý oddeľuje produktívne laby od ostatných. Pre každého, kto buduje AI tímy alebo premýšľa o organizácii výskumu, je toto primárny zdrojový materiál.
O tom, ako skoro mohol ChatGPT vzniknúť: "With full hindsight, I think you could have gotten something back in 2018 or 2019 with a few people that would get to GPT 3.5 level... nanoGPT is just programmed by one person and runs on one box." Implikácia: bariéra boli znalosti a presvedčenie, nie compute alebo veľkosť tímu. Malá skupina so správnymi pohľadmi mohla postaviť roky skôr.
O kultúre skorého OpenAI: "It was more rag tag, maybe even like an academic group... a bunch of different research projects driven by people's own taste, groups of one to three people working on something that would turn into a paper or blog post." Formatívne roky neboli koordinovaný moonshot - boli to prieskumné výskumy, ktoré sa nakoniec skryštalizovali do niečoho väčšieho.
O zlyhalom projekte Universe: "There was a project called Universe... the idea was to collect lots of video games and web navigation tasks. It ended up being unsuccessful at the time, but the funny thing is I think it was a deeply correct idea, just a decade too early." Vzor: dobré myšlienky zlyhávajú, keď chýbajú predpoklady, potom uspejú, keď sa podmienky zmenia.
O kompromisoch manažmentu výskumu: "I've seen very different approaches be successful. One model where the manager writes a lot of code, reads all their reports' code, gives detailed technical feedback. I've also seen more hands-off managers who are just sounding boards... both work in different places." Prieskumný výskum potrebuje hands-off; exekučný mód potrebuje hands-on. Kontext určuje štýl.
O tom, ako používa AI pre výskum: "If I have an idea, I'll fire off a bunch of questions to GPT-5 Pro and have it do literature searches. Sometimes I'll write a paragraph and tell the model to flesh it out... definitely the literature search ability is extremely useful." Aj top výskumníci používajú LLM pre prvé kolo spätnej väzby a objavovanie literatúry.
Kľúčové poznatky
- ChatGPT sa mohol postaviť roky skôr - S plným nadhľadom, malý tím v 2018-2019 mohol dosiahnuť úroveň GPT-3.5; bariéra bol pohľad, nie zdroje
- Skoré OpenAI bolo v akademickom štýle - Malé skupiny 1-3 ľudí sledujúce vlastný výskumný vkus, nie koordinovaný moonshot; väčšie projekty vznikli neskôr
- "Správne, ale príliš skoro" je vzor - Universe (RL prostredia) bola správna myšlienka desaťročie pred existenciou predpokladov; zlyhané projekty sa často vracajú
- Manažment výskumu je kontextovo závislý - Hands-on funguje pre exekúciu a juniorov; hands-off funguje pre prieskum a skúsených IC
- Value functions sa vrátia - Momentálne nedostatočne využívané v LLM RL, ale Schulman očakáva ich návrat, keď sa časové horizonty predĺžia
- Thinking Machines balancuje dobiehanie s prieskumom - Nové laby musia replikovať state-of-art, zatiaľ čo budujú prieskumný výskumný sval; kultúra sa ťažko pridáva neskôr
Veľký obraz
Schulmanova perspektíva demystifikuje frontier AI výskum. Kľúčový pohľad: skoré OpenAI nebolo perfektne organizovaný moonshot - bol to prieskumný výskum, ktorý nakoniec konvergoval na scaling. ChatGPT kontrafaktuál (staviteľný v 2018 s nadhľadom) naznačuje, že limitujúci faktor nie je compute alebo veľkosť tímu, ale znalosti a presvedčenie. Pre organizácie budujúce AI výskumné kapacity je implikácia, že kultúra a výskumný vkus záležia viac ako zdroje a že myšlienky "správne, ale príliš skoro" stojí za sledovanie, pretože podmienky sa nakoniec zmenia.


