当前位置: 首页 > news >正文

RAG-概述

RAG 概述

        RAG(Retrieval Augmented Generation, 检索增强生成)是一种技术框架,其核心在于当 LLM 面对解答问题或创作文本任务时,首先会在大规模文档库中搜索并筛选出与任务紧密相关的素材,继而依据这些素材精准指导后续的回答生成或文本构造过程,旨在通过此种方式提升模型输出的准确性和可靠性。

       

RAG 技术架构图

RAG 主要包含哪些

1. 核心组件

  1. 检索器(Retriever)

    • 功能:从外部知识库中检索与输入问题相关的信息。

    • 技术:通常使用密集检索(如基于BERT的向量嵌入)或稀疏检索(如BM25),计算查询与文档的相似度。

    • 输出:返回最相关的文档片段或段落。

  2. 生成器(Generator)

    • 功能:基于检索结果和用户输入,生成自然语言回答。

    • 技术:常用预训练语言模型(如GPT、T5),可能针对特定任务微调。

    • 输入:用户问题 + 检索到的上下文。

  3. 知识库(Knowledge Base)

    • 存储内容:结构化或非结构化数据(如文档、网页、数据库)。

    • 形式:常以向量数据库(如FAISS、Pinecone)存储,支持高效相似性搜索。


2. 关键流程

  1. 预处理与索引构建

    对知识库数据进行分块、清洗、嵌入(Embedding),并构建索引以便快速检索。
  2. 检索阶段

    将用户查询编码为向量,从知识库中检索Top-K相关文档。
  3. 生成阶段

    将检索结果与原始问题拼接,输入生成模型产生最终回答。

RAG分块策略

        RAG-分块策略-CSDN博客

相关文章:

  • `get_peft_model` 是 `peft` 库什么方法
  • 基于亚博K210开发板——内存卡读写文件
  • 如何删除 Launchpad 中 Chrome 的图标
  • java输出、输入语句
  • 【SAP ME 43】RESRCE表操作导致HANA中表锁定解决方案
  • Linux:简单指令(二)
  • Hutool之DateUtil:让Java日期处理变得更加简单
  • Charles破解 激活码 Java
  • 【Python语言基础】22、异常处理
  • 练习(杨辉三角、字符串旋转)
  • 轻量化高精度的视频语义分割
  • std::unordered_set(C++)
  • 黑马点评:附近商铺+用户签到+UV统计【学习笔记】
  • Spring Boot资源耗尽问题排查与优化
  • Agent的九种设计模式 介绍
  • 基于PySide6与pyCATIA的圆柱体特征生成工具开发实战——NX建模之圆柱命令的参考与移植
  • 在 Babylon.js 中实现智能异步资源加载队列管理
  • React 事件处理基础
  • eNSP无法启动AR报错码40,而且按照eNSP帮助手册排查都没用,我的处理方法【自己存档版】
  • 关于使用webpack构建的vue项目,如何使用windicss
  • 江苏一季度实现地区生产总值3.3万亿元,同比增长5.9%
  • GDP增长4.1%,一季度广东经济数据出炉
  • 谁在贩卖个人信息?教培机构信息失守,电商平台“订单解密”
  • 季度市场叙事|时间已不在美国那边
  • 接续《莱茵的黄金》,国家大剧院带来7国艺术家的《女武神》
  • 法治课|男子同时与两名女子办婚礼闹剧,是否应受处罚?