Newsfeed / John Schulman: ChatGPT mohl být postaven v roce 2018
Dwarkesh Patel·December 19, 2025

John Schulman: ChatGPT mohl být postaven v roce 2018

Spoluzakladatel OpenAI odhaluje, že rané OpenAI bylo 'roztříštěné jako akademická skupina' a proč dobré nápady selhávají, když chybí předpoklady.

John Schulman: ChatGPT mohl být postaven v roce 2018

Jak John Schulman vidí počátky frontier AI výzkumu

John Schulman spoluzaložil OpenAI, vytvořil PPO (algoritmus za RLHF) a nedávno odešel založit Thinking Machines. Tento vzácný rozhovor nabízí insider pohled na to, jak frontier AI výzkum skutečně funguje: falešné starty, organizační kulturu, výzkumný vkus, který odděluje produktivní laboratoře od ostatních. Pro kohokoli budujícího AI týmy nebo přemýšlejícího o výzkumné organizaci je toto primární zdrojový materiál.

O tom, jak brzy mohl ChatGPT vzniknout: "With full hindsight, I think you could have gotten something back in 2018 or 2019 with a few people that would get to GPT 3.5 level... nanoGPT is just programmed by one person and runs on one box." (S plným zpětným pohledem si myslím, že byste mohli dostat něco v roce 2018 nebo 2019 s pár lidmi, co by se dostalo na úroveň GPT 3.5... nanoGPT je jen naprogramováno jednou osobou a běží na jednom boxu.) Důsledek: bariérou byly znalosti a přesvědčení, ne compute nebo velikost týmu. Malá skupina se správnými postřehy to mohla postavit o roky dříve.

O kultuře raného OpenAI: "It was more rag tag, maybe even like an academic group... a bunch of different research projects driven by people's own taste, groups of one to three people working on something that would turn into a paper or blog post." (Bylo to více roztříštěné, možná dokonce jako akademická skupina... spousta různých výzkumných projektů řízených vlastním vkusem lidí, skupiny jednoho až tří lidí pracujících na něčem, co se změní v paper nebo blog post.) Formativní roky nebyly koordinovaný moonshot - byl to průzkumný výzkum, který se nakonec krystalizoval do něčeho většího.

O neúspěšném projektu Universe: "There was a project called Universe... the idea was to collect lots of video games and web navigation tasks. It ended up being unsuccessful at the time, but the funny thing is I think it was a deeply correct idea, just a decade too early." (Byl projekt zvaný Universe... nápad byl sbírat spoustu videoher a web navigačních úkolů. Skončil v té době neúspěšný, ale vtipné je, že myslím, že to byl hluboce správný nápad, jen o dekádu předčasný.) Vzorec: dobré nápady selhávají, když chybí předpoklady, pak uspívají, když se podmínky změní.

O kompromisech výzkumného managementu: "I've seen very different approaches be successful. One model where the manager writes a lot of code, reads all their reports' code, gives detailed technical feedback. I've also seen more hands-off managers who are just sounding boards... both work in different places." (Viděl jsem velmi odlišné přístupy být úspěšné. Jeden model, kde manažer píše hodně kódu, čte veškerý kód svých reportů, dává detailní technickou zpětnou vazbu. Také jsem viděl více hands-off manažery, kteří jsou jen sounding boards... oba fungují na různých místech.) Průzkumný výzkum potřebuje hands-off; exekuční mód potřebuje hands-on. Kontext určuje styl.

O tom, jak používá AI pro výzkum: "If I have an idea, I'll fire off a bunch of questions to GPT-5 Pro and have it do literature searches. Sometimes I'll write a paragraph and tell the model to flesh it out... definitely the literature search ability is extremely useful." (Pokud mám nápad, vypálím spoustu otázek na GPT-5 Pro a nechám ho dělat literární rešerše. Někdy napíšu odstavec a řeknu modelu, aby ho rozvedl... rozhodně schopnost literárního vyhledávání je extrémně užitečná.) I top výzkumníci používají LLM pro první kolo zpětné vazby a literární objevování.

6 postřehů od Johna Schulmana o výzkumné kultuře a pokroku AI

  • ChatGPT mohl být postaven o roky dříve - S plným zpětným pohledem malý tým v 2018-2019 mohl dosáhnout úrovně GPT-3.5; bariérou byl postřeh, ne zdroje
  • Rané OpenAI bylo akademického stylu - Malé skupiny 1-3 lidí sledujících svůj vlastní výzkumný vkus, ne koordinovaný moonshot; větší projekty vznikly později
  • "Správné ale příliš brzy" je vzorec - Universe (RL prostředí) byl správný nápad dekádu před tím, než existovaly předpoklady; neúspěšné projekty se často vracejí
  • Výzkumný management je závislý na kontextu - Hands-on funguje pro exekuci a juniorní lidi; hands-off funguje pro průzkum a zkušené IC
  • Value funkce udělají comeback - Aktuálně nedostatečně využívané v LLM RL, ale Schulman očekává, že se vrátí, jak se časové horizonty prodlužují
  • Thinking Machines balancuje dohánění s průzkumem - Nové laboratoře musí replikovat state-of-art zatímco budují svaly průzkumného výzkumu; kulturu je těžké přidat později

Co to znamená pro organizace AI výzkumu

Schulmanova perspektiva demystifikuje frontier AI výzkum. Klíčový postřeh: rané OpenAI nebyl dokonale organizovaný moonshot - byl to průzkumný výzkum, který se nakonec sblížil na scalingu. ChatGPT counterfactual (postavitelný v 2018 se zpětným pohledem) naznačuje, že limitujícím faktorem není compute nebo velikost týmu, ale znalosti a přesvědčení. Pro organizace budující schopnosti AI výzkumu je důsledek, že kultura a výzkumný vkus záleží více než zdroje, a že "správné ale příliš brzy" nápady stojí za sledování, protože podmínky se nakonec změní.

Related