接地
/ˈɡraʊndɪŋ/
Also known as: AI grounding, knowledge grounding, factual grounding
technical intermediate
什么是接地?
AI 中的接地是指将模型的输出连接到经过验证的外部知识来源,而不是仅依赖训练期间学到的信息。目标是将响应锚定在事实的、可检索的信息中——减少幻觉并实现来源验证。
可以将其想象为某人从记忆中说话与某人可以在说话时检查来源之间的区别。
为什么接地很重要
在互联网数据上训练的大语言模型在其参数中编码知识,但这些知识:
- 可能过时(训练数据有截止日期)
- 可能不正确(在不准确的来源上训练)
- 缺乏引用(无法指出信息来自哪里)
- 在压力下退化(不确定时自信地猜测)
接地通过在生成之前提供 外部事实作为上下文 来解决这些问题。
检索增强生成(RAG)
RAG 是接地 AI 系统的主要技术。过程:
- 用户提交查询
- 检索系统搜索知识库以获取相关文档
- 检索的内容被添加到大语言模型的上下文中
- 大语言模型生成响应,基于检索的信息
- 可以引用来源与响应一起
这种方法确保模型可以访问准确、最新的信息,并可以指出其来源。
技术实现
嵌入:文档被转换为捕获语义含义的数值向量(嵌入)。
向量数据库:这些嵌入存储在专门为相似性搜索优化的数据库中。
检索:当查询到达时,它也被嵌入,并检索最相似的文档。
增强提示:检索的文档被添加到提示中,为大语言模型提供事实上下文。
接地的好处
| 好处 | 描述 |
|---|---|
| 减少幻觉 | 事实来自经过验证的来源,而不是模型记忆 |
| 最新信息 | 知识库可以持续更新 |
| 来源引用 | 用户可以像”研究论文中的脚注”一样验证声明 |
| 领域特定性 | 基于专有数据进行企业用例 |
| 成本效率 | 无需重新训练模型即可添加新知识 |
RAG 变体(2025)
该领域已超越基本 RAG:
- 传统 RAG:标准检索 + 生成
- Self-RAG:模型决定何时检索
- Corrective RAG:验证和纠正检索的信息
- GraphRAG:使用知识图谱进行结构化检索
- Adaptive RAG:根据查询复杂性调整检索策略
企业采用
在 2025 年,通过 RAG 的接地在各行业都是必不可少的:
- 客户支持:访问产品文档
- 医疗保健:基于医学文献
- 法律:引用案例法和法规
- 金融:实时市场数据集成
限制
接地并不完美:
- 检索质量:检索差 = 接地差
- 上下文限制:大语言模型只能处理有限的上下文
- 延迟:检索增加响应时间
- 维护:知识库需要管理