Demis Hassabis o svetových modeloch, chýbajúcich kúskoch AGI a tom, prečo Genie všetko mení
Riaditeľ Google DeepMind diskutuje, prečo sú svetové modely nevyhnutné pre AGI, problém asymetrické inteligencie a ako by agenti Genie učiaci sa v simulovaných svetoch mohli odomknúť robotiku.
Perspektíva
To je Demis Hassabis na svojom domácom pôde - podcast Google DeepMind s Hannah Fry - hovorí o tom, kde sa AI vlastne nachádza oproti tomu, kde musí byť pre AGI. Rozhovor je povzbudzujúco technicky detailný a poctivý o súčasných obmedzeniach.
Rámec "asymetrickej inteligencie" je kľúčový pre pochopenie, prečo ešte nemáme AGI. Súčasné modely môžu vyhrať zlaté medaily na Medzinárodnej matematickej olympiáde, zatiaľ čo zlyhávajú pri základných logických úlohách. Vedia analyzovať komplexnú filozofiu, ale zápasia s konzistentnou hrou v šachoch. Hassabis to nepovažuje za malú chybu - je to fundamentálna architektonická medzera. "Očakávali by ste od systému AGI, že by bol konzistentný na všetkých frontoch."
Svetové modely sú najdlhodobejšou vášňou Hassabisa, a tento rozhovor vysvetľuje, prečo si myslí, že sú nevyhnutné. Jazykové modely pochádzajú viac o svete ako jazykári očakávali - "jazyk je bohatší ako sme si mysleli" - ale priestorová dynamika, intuitívna fyzika a senzoromotorika nemôžu byť zachytené v texte. Pre robotiku a skutočne univerzálnych asistentov potrebujete systémy, ktoré rozumejú príčinám a následkom v fyzickom priestore.
Slučka Genie + Simma je skutočným headlines. Spúšťajú AI agentov (Simma) do AI-generovaných svetov (Genie) a nechávajú ich interagovať. "Tieto dve AI sa akosi vzájomne ovplyvňujú v myšlienkach jednej druhej." Toto vytvára potenciálne nekonečné tréningové prostredie, kde Genie generuje všetky scenáre, ktoré Simma potrebuje na učenie. Je to elegantné riešenie problému tréningových dát pre embodied AI.
Na hallucinácie Hassabis robí jemný, ale dôležitý bod: problém nie je v tom, že modely sú neisté, ale v tom, že nevedia, že sú neisté. AlphaFold poskytuje skóre spoľahlivosti; LLMs často áno. Lepšie modely "vedia viac o tom, čo vedia" a môžu introspektovať svoju neistotu. Oprava vyžaduje použitie myšlienkových krokov na dvojitú kontrolu výstupov - systémy, ktoré "sa zastavujú, pozastavujú a posúdia, čo práve chceli povedať."
Debate o škálovaní dostáva nuansovaný prístup. DeepMind nenarazil na stenu - Gemini 3 ukazuje významné zlepšenia - ale výnosy už nie sú exponenciálne. "Medzi exponenciálnym a asymptotickým je veľa priestoru." Jeho vzorec: 50% škálovaní, 50% inovácia. Obe sú potrebné pre AGI.
Kľúčové poznatky
- Asymetrická inteligencia je základnou bariérou AGI - Modely vynikajú v úlohách na úrovni PhD, zatiaľ čo zlyháva na vysokoškolskej logike; konzistencia v doménach chýba
- Svetové modely sú nevyhnutné pre embodied AI - Priestorová dynamika, intuitívna fyzika a senzoromotorika nemôžu byť naučené len z textu
- Genie + Simma vytvára nekonečné tréningové slučky - AI agenti v AI-generovaných svetoch by mohli vyriešiť problém dát pre robotiku
- Halucinácie pochádzajú z meta-nevedomosti - Modely nevedia, čo nevedia; potrebujú skóre spoľahlivosti ako AlphaFold
- Škálovaní nie je mŕtve, len nie exponenciálne - DeepMind pracuje na 50% škálovaní, 50% inovácia; obe sú potrebné pre AGI
- Fúzia je problémom koreňového uzla - Partnerstvo s Commonwealth Fusion na zrýchlenie čistej energie prostredníctvom AI-asistovaného zadržiavania plazmy
- Online učenie stále chýba - Súčasné modely sa prestanú učiť po nasadení; toto je kritická medzera
- Fyzikálne benchmarky potrebné pre svetové modely - Generované videá vyzerajú realisticky, ale nie sú dostatočne fyzikálne presné pre robotiku
Veľký obrázok
Súčasná AI je "asymetrická" - brilantná v úzkych úlohách, nespoľahlivá v rámci domén. Cesta k AGI pravdepodobne vyžaduje svetové modely, ktoré chápajú fyziku a kauzalitu, nie len vzory jazyka. Stávka DeepMind: tréniť agentov v AI-generovaných svetoch, kým nenadobudnú intuíciu o tom, ako realita funguje.


