Demis Hassabis z Google DeepMind v rozhovoru s Mikem Allenem od Axios
Nositel Nobelovy ceny Demis Hassabis o časových lhůtách AGI, multimodálních průlomech a tom, proč je vědecká metoda jeho konkurenční výhodou.
Perspektiva
Toto je Demis Hassabis v jeho nejupřímnější podobě - 400 dní po Nobelově ceně, uvažuje o tom, co mu tato platforma umožňuje a kam se AI skutečně ubírá. Bez nadřímání, jen klinické posouzení od někoho, kdo směřuje k AGI už desítky let.
Vědecká metoda jako konkurenční výhoda je vláknem, které provází vším. Hassabis DeepMind odlišuje ne svými zdroji (ačkoliv Google je má) ale rigorózností: "Kombinujeme světovou třídu výzkum se světovou třídou inženýrstvím a světovou třídou infrastrukturou. Musíte mít všechny tři na hranici."
Toto není prázdné pozicování. Když je otázán na přesun na LLM v roce 2017-2018, je osvěžujícím způsobem upřímný: byl agnostik vůči přístupu. Měli Chinchillu, Sparrow, AlphaZero-style RL systémy a neurovědy inspirované architektury všechny běžící paralelně. Když začala škálování ukazovat výsledky, pragmaticky přesunuli zdroje. "Pokud jste opravdu vědecký, nemůžete být příliš dogmatický ohledně některé myšlenky, kterou máte."
Časová lhůta AGI je konkrétní: 5-10 let, ale s vysokou latkou. Jeho definice vyžaduje "všechny kognitivní schopnosti, které máme" včetně vynálézavosti a kreativity. Současné modely jsou "nerovnoměrné inteligence" - na úrovni doktorátu v některých oblastech, vadné v jiných. Pravá AGI znamená konzistenci na všech frontách plus schopnosti, které ještě neexistují: kontinuální učení, online učení, dlouhodobé plánování.
Odhaduje, že "jeden nebo dva další průlomy na úrovni transformeru" jsou stále potřeba mimo škálování. Ne inkrementální inovace - fundamentální pokroky.
Multimodální náhled je podceňován. Hassabis říká, že nejúžasnější věc, které se věnuje příliš málo pozornosti, je porozumění videu. Testoval Gemini na Fight Clubu, ptal se na významnost postavy odebírající si prsten před bojem - a dostál "velmi zajímavý filozofický bod" o symbolickém opuštění každodenního života. To je koncepční porozumění vizuálnímu příběhu, ne jen rozpoznávání vzorů.
O katastrofálním riziku je vyvážený: P(doom) je "nenulová" ale odmítá přesná procenta jako "nesmysl, protože nikdo neví." Na čem se zavazuje: pokud je nenulová, "musíte věnovat významné zdroje a pozornost tomu."
Úhel kapitalismus je zajímavý - tvrdí, že zákaznící podnikatelů žádající záruky budou přirozeně odměňovat odpovědné poskytovatele. Model, který se vymkne kontrole, ztrácí obchodní podíl. Zda tato struktura pobídek vydrží pro systémy na úrovni AGI je otevřená otázka, kterou plně neřeší.
O závodě s Čínou: náskok je "měsíce, ne roky." Čínské laboratoře neukazují algoritmickou inovaci mimo hranici, ale jsou vynikající v rychlém nápodobování. Mezera se zužuje.
Hlavní poznatky
- AGI: 5-10 let - Vyžaduje všechny lidské kognitivní schopnosti včetně vynálézavosti; současné modely jsou "nerovnoměrné inteligence"
- 1-2 průlomy stále potřebné - Samotné škálování pravděpodobně nestačí; očekává pokroky na úrovni transformeru
- Multimodalita je podceňována - Porozumění videu ukazuje koncepční uchopení příběhu, ne jen rozpoznávání vzorů
- Vědecká metoda je výhoda - Pragmatický přístup umožnil DeepMind přeorientovat se, když škálování ukázalo výsledky
- P(doom) je nenulová - Odmítá kvantifikaci ale věnuje významné zdroje bezpečnosti
- Náskok Číny: měsíce, ne roky - Rychle nápodobují, ale neukazují inovaci na hranici
- Nobelova platforma je důležitá - Otevírá dveře pro obhajobu zodpovědného vývoje AI
- Agenti přicházejí ale jsou nespolehliví - Během roku blízko delegování kompletních úkolů; vize univerzálního asistenta
Velký obrázek
Nositel Nobelovy ceny odhaduje AGI za 5-10 let, ale říká, že 1-2 průlomy na úrovni transformeru jsou stále potřebné. Současné modely jsou "nerovnoměrné inteligence" - na úrovni doktorátu v některých oblastech, vadné v jiných. Cesta vyžaduje konzistenci v různých doménách plus schopnosti, které ještě neexistují: kontinuální učení, online učení, dlouhodobé plánování.


