Světové modely

wurld MOD-els

architecture advanced

Definice

Světové modely jsou AI systémy, které se učí simulovat a predikovat, jak fyzický svět funguje - včetně prostorové dynamiky, intuitivní fyziky a vztahů příčina-následek, které nelze naučit pouze z textu.

Proč to záleží

Současné jazykové modely se učí z textu, který zachycuje mnoho o světě, ale postrádá ztělesněné znalosti - jak objekty padají, jak síly interagují, jak prostor funguje. Světové modely mají za cíl vyplnit tuto mezeru.

Klíčové koncepty

Za hranice jazyka

“Language is richer than we thought, but spatial dynamics, intuitive physics, and sensorimotor experience can’t be captured in text.”

“Jazyk je bohatší, než jsme si mysleli, ale prostorová dynamika, intuitivní fyzika a senzomotorická zkušenost nemohou být zachyceny v textu.” — Demis Hassabis

Genie + Simma

Přístup Google DeepMind: vhodit AI agenty (Simma) do AI-generovaných světů (Genie) a nechat je interagovat, vytvářející nekonečná tréninková prostředí.

“The two AIs are kind of interacting in the minds of each other.”

“Tyto dvě AI jaksi interagují v myslích toho druhého.”

Přesnost fyziky

Generovaná videa mohou vypadat realisticky, ale nejsou fyzikálně dostatečně přesná pro robotiku. Skutečné světové modely potřebují korektně predikovat fyzické výsledky.

Aplikace

  • Robotika: Agenti potřebují intuitivní fyziku pro navigaci v reálných prostředích
  • Plánování: Porozumění příčině a následku umožňuje lepší dlouhodobé uvažování
  • Simulace: Trénování v simulovaných světech před nasazením v realitě

Současná omezení

  • Generování videa vypadá realisticky, ale nerespektuje fyziku
  • Modely postrádají ukotvené porozumění prostorovým vztahům
  • Online učení (pokračující učení po nasazení) stále chybí

Související termíny

Mentioned In

Video thumbnail

Demis Hassabis

Language is richer than we thought, but spatial dynamics, intuitive physics, and sensorimotor experience can't be captured in text.

Related Terms