Světové modely
wurld MOD-els
Definice
Světové modely jsou AI systémy, které se učí simulovat a predikovat, jak fyzický svět funguje - včetně prostorové dynamiky, intuitivní fyziky a vztahů příčina-následek, které nelze naučit pouze z textu.
Proč to záleží
Současné jazykové modely se učí z textu, který zachycuje mnoho o světě, ale postrádá ztělesněné znalosti - jak objekty padají, jak síly interagují, jak prostor funguje. Světové modely mají za cíl vyplnit tuto mezeru.
Klíčové koncepty
Za hranice jazyka
“Language is richer than we thought, but spatial dynamics, intuitive physics, and sensorimotor experience can’t be captured in text.”
“Jazyk je bohatší, než jsme si mysleli, ale prostorová dynamika, intuitivní fyzika a senzomotorická zkušenost nemohou být zachyceny v textu.” — Demis Hassabis
Genie + Simma
Přístup Google DeepMind: vhodit AI agenty (Simma) do AI-generovaných světů (Genie) a nechat je interagovat, vytvářející nekonečná tréninková prostředí.
“The two AIs are kind of interacting in the minds of each other.”
“Tyto dvě AI jaksi interagují v myslích toho druhého.”
Přesnost fyziky
Generovaná videa mohou vypadat realisticky, ale nejsou fyzikálně dostatečně přesná pro robotiku. Skutečné světové modely potřebují korektně predikovat fyzické výsledky.
Aplikace
- Robotika: Agenti potřebují intuitivní fyziku pro navigaci v reálných prostředích
- Plánování: Porozumění příčině a následku umožňuje lepší dlouhodobé uvažování
- Simulace: Trénování v simulovaných světech před nasazením v realitě
Současná omezení
- Generování videa vypadá realisticky, ale nerespektuje fyziku
- Modely postrádají ukotvené porozumění prostorovým vztahům
- Online učení (pokračující učení po nasazení) stále chybí
Související termíny
- Jagged Intelligence - Problém, který světové modely mohou pomoci vyřešit
- Embodied AI - AI systémy, které interagují s fyzickým světem