RAG(Retrieval-Augmented Generation,检索增强生成)
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合 信息检索 和 文本生成 的技术,旨在提升大语言模型(LLM)生成内容的准确性和时效性。其核心思想是:先检索相关知识,再基于检索结果生成回答,从而弥补纯生成模型(如GPT)的固有缺陷。
一、RAG 的核心原理
-
工作流程:
-
检索(Retrieval):从外部知识库(如数据库、文档)中查找与用户问题相关的信息。
-
增强(Augmentation):将检索到的内容作为上下文插入到LLM的输入中。
-
生成(Generation):LLM 结合检索到的知识和自身预训练知识生成最终回答。
-
-
技术对比:
方法 优点 缺点 纯生成模型 无需额外数据,回答流畅 容易“幻觉”(编造事实),知识过时 RAG 回答更准确,可动态更新知识 依赖检索质量,响应速度略慢
二、RAG 的典型应用场景
-
知识密集型问答
-
例如:回答“2023年诺贝尔经济学奖得主是谁?”
-
RAG作用:实时检索权威新闻或数据库,确保答案最新。
-
-
客服系统
-
例如:用户问“如何重置密码?”
-
RAG作用:检索企业最新文档,生成标准化回复。
-
-
学术/法律咨询
-
例如:“《民法典》中关于租赁合同的规定有哪些?”
-
RAG作用:从法律条文库中检索相关条款,生成解读。
-