RAG现有技术方案
RAG现有技术方案
一、现有技术方案的核心问题
-
检索质量不足
- 挑战:传统RAG系统依赖单轮检索,难以应对智能电网的海量异构数据(如传感器读数、控制参数),导致检索结果相关性低、覆盖不全。
- 案例:BM25稀疏检索在处理长文本或专业术语时,易遗漏语义关联;BGE等稠密检索模型对新兴词汇的表征能力有限。
-
响应可靠性差
- 问题:LLM可能受无关上下文误导,或因参数记忆与非参数记忆混淆产生“幻觉”(如虚构电网故障处理流程)。
- 数据:传统RAG在智能电网场景中的答案准确率仅56.46%,上下文召回率59.73%。
-
计算效率与扩展性
- 矛盾:HyDE、ITRG等方案通过迭代检索提升性能,但显著增加token消耗(如Self-RAG单轮问答消耗769 tokens),难以满足实时性要求。