Ukotvení
/ˈɡraʊndɪŋ/
Also known as: AI grounding, knowledge grounding, factual grounding
Co je ukotvení?
Ukotvení v AI označuje propojení výstupů modelu s ověřenými externími zdroji znalostí místo spoléhání pouze na informace naučené během tréninku. Cílem je zakotvit odpovědi ve faktických, vyhledatelných informacích—snížit halucinace a umožnit ověření zdrojů.
Představte si to jako rozdíl mezi někým, kdo mluví z paměti, versus někým, kdo může kontrolovat svoje zdroje, když mluví.
Proč záleží na ukotvení
LLM trénované na internetových datech kódují znalosti ve svých parametrech, ale tyto znalosti:
- Mohou být zastaralé (trénovací data mají datum ukončení)
- Mohou být nesprávné (trénované na nepřesných zdrojích)
- Postrádají citace (nemohou ukázat, odkud informace pocházejí)
- Degradují pod tlakem (sebevědomé hádání při nejistotě)
Ukotvení řeší tyto problémy poskytnutím externích faktů jako kontextu před generováním.
Retrieval-Augmented Generation (RAG)
RAG je primární technikou pro ukotvení AI systémů. Proces:
- Uživatel předloží dotaz
- Retrieval systém vyhledá relevantní dokumenty ve znalostní bázi
- Získaný obsah je přidán do kontextu LLM
- LLM generuje odpověď ukotvenou ve získaných informacích
- Zdroje mohou být citovány vedle odpovědi
Tento přístup zajišťuje, že model má přístup k přesným, aktuálním informacím a může ukázat na své zdroje.
Technická implementace
Embeddings: Dokumenty jsou převedeny na numerické vektory (embeddingy), které zachycují sémantický význam.
Vektorové databáze: Tyto embeddingy jsou uloženy ve specializovaných databázích optimalizovaných pro vyhledávání podobnosti.
Získávání: Když přijde dotaz, je také embeddován a nejpodobnější dokumenty jsou získány.
Rozšířené promptování: Získané dokumenty jsou přidány do promptu, poskytující LLM faktický kontext.
Výhody ukotvení
| Výhoda | Popis |
|---|---|
| Snížené halucinace | Fakta pocházejí z ověřených zdrojů, ne paměti modelu |
| Aktuální informace | Znalostní báze může být průběžně aktualizována |
| Citace zdrojů | Uživatelé mohou ověřit tvrzení jako “poznámky pod čarou ve výzkumné práci” |
| Doménová specificita | Ukotvení v proprietárních datech pro podnikové případy použití |
| Nákladová efektivita | Není potřeba přetrénovat modely pro přidání nových znalostí |
RAG varianty (2025)
Oblast se vyvinula za základní RAG:
- Tradiční RAG: Standardní získávání + generování
- Self-RAG: Model se rozhoduje, kdy získávat
- Corrective RAG: Validuje a opravuje získané informace
- GraphRAG: Používá znalostní grafy pro strukturované získávání
- Adaptive RAG: Přizpůsobuje strategii získávání podle složitosti dotazu
Podniková adopce
V roce 2025 je ukotvení přes RAG zásadní napříč odvětvími:
- Zákaznická podpora: Přístup k produktové dokumentaci
- Zdravotnictví: Ukotvení v lékařské literatuře
- Právní: Citace k judikatuře a regulacím
- Finance: Integrace real-time tržních dat
Omezení
Ukotvení není dokonalé:
- Kvalita získávání: Špatné získávání = špatné ukotvení
- Limity kontextu: LLM mohou zpracovat pouze omezený kontext
- Latence: Získávání přidává čas odezvy
- Údržba: Znalostní báze potřebují kurátorování
Související čtení
- Hallucination - Problém, který ukotvení řeší
- Confabulation - Hintonovo přerámování problému