当前位置：首页 > news >正文

RAG-概述

news 来源：原创 2025/4/23 0:52:56

RAG 概述

RAG（Retrieval Augmented Generation, 检索增强生成）是一种技术框架，其核心在于当 LLM 面对解答问题或创作文本任务时，首先会在大规模文档库中搜索并筛选出与任务紧密相关的素材，继而依据这些素材精准指导后续的回答生成或文本构造过程，旨在通过此种方式提升模型输出的准确性和可靠性。

RAG 技术架构图

RAG 主要包含哪些

1. 核心组件

检索器（Retriever）
- 功能：从外部知识库中检索与输入问题相关的信息。
- 技术：通常使用密集检索（如基于BERT的向量嵌入）或稀疏检索（如BM25），计算查询与文档的相似度。
- 输出：返回最相关的文档片段或段落。
生成器（Generator）
- 功能：基于检索结果和用户输入，生成自然语言回答。
- 技术：常用预训练语言模型（如GPT、T5），可能针对特定任务微调。
- 输入：用户问题 + 检索到的上下文。
知识库（Knowledge Base）
- 存储内容：结构化或非结构化数据（如文档、网页、数据库）。
- 形式：常以向量数据库（如FAISS、Pinecone）存储，支持高效相似性搜索。

2. 关键流程

预处理与索引构建
对知识库数据进行分块、清洗、嵌入（Embedding），并构建索引以便快速检索。
检索阶段
将用户查询编码为向量，从知识库中检索Top-K相关文档。
生成阶段
将检索结果与原始问题拼接，输入生成模型产生最终回答。

RAG分块策略

RAG-分块策略-CSDN博客

相关文章：

`get_peft_model` 是 `peft` 库什么方法

基于亚博K210开发板——内存卡读写文件

如何删除 Launchpad 中 Chrome 的图标

java输出、输入语句

【SAP ME 43】RESRCE表操作导致HANA中表锁定解决方案

Linux:简单指令（二）

Hutool之DateUtil：让Java日期处理变得更加简单

Charles破解激活码 Java

【Python语言基础】22、异常处理

练习（杨辉三角、字符串旋转）

轻量化高精度的视频语义分割

std::unordered_set(C++)

黑马点评：附近商铺+用户签到+UV统计【学习笔记】

Spring Boot资源耗尽问题排查与优化

Agent的九种设计模式介绍

基于PySide6与pyCATIA的圆柱体特征生成工具开发实战——NX建模之圆柱命令的参考与移植

在 Babylon.js 中实现智能异步资源加载队列管理

React 事件处理基础

eNSP无法启动AR报错码40，而且按照eNSP帮助手册排查都没用，我的处理方法【自己存档版】

关于使用webpack构建的vue项目，如何使用windicss

江苏一季度实现地区生产总值3.3万亿元，同比增长5.9%

GDP增长4.1%，一季度广东经济数据出炉

谁在贩卖个人信息？教培机构信息失守，电商平台“订单解密”

季度市场叙事｜时间已不在美国那边

接续《莱茵的黄金》，国家大剧院带来7国艺术家的《女武神》

法治课｜男子同时与两名女子办婚礼闹剧，是否应受处罚？