定义
RAG(Retrieval-Augmented Generation)是先检索外部知识,再由模型生成回答的应用模式。
核心内涵
RAG 技术通过将大语言模型的参数化记忆与外部数据库的非参数化记忆相结合,有效缓解了模型幻觉问题,并突破了模型训练数据的时效性限制。它使得 AI 系统能够基于企业私有数据或最新公开信息进行精准推理,是构建高可靠性知识问答与智能体系统的关键架构。
实践要点
- 检索质量决定生成上限,需重点优化文档切分策略、向量化模型选择及混合检索算法。
- 建立动态更新的上下文数据库,确保底层知识源的准确性与时效性。
- 在提示词中明确要求模型仅基于检索到的上下文进行回答,以最大化控制生成风险。
- 引入重排机制与上下文压缩技术,在有限的上下文窗口内提供最高价值的信息密度。