当前位置: 首页 > news >正文

rag搭建,是如何进行向量匹配检索的?

RAG 里为什么要“向量检索”?

在 Retrieval-Augmented Generation (RAG) 中,我们的目标是让 LLM 能够“回答它本身不知道的内容”。做法是:

  1. 将知识(文本)进行向量化,存入向量数据库;
  2. 用户提问后,也将问题向量化;
  3. 去数据库里 找出与这个问题最相似的一批知识,返回喂给 LLM。

向量匹配检索:原理解析

第一步:构建向量数据库(也叫“知识库”)

比如你有一大段文档,做法是:

  1. 切分成 chunk(段落),如每 300 字为一个段;
  2. 每个 chunk 用 Embedding 模型(如 OpenAI 的 text-embedding-ada-002 或 BGE) 转成一个向量:
    "向量" = 文本的语义表示,一个高维空间中的点。
    
  3. 把每个向量连带元信息&#x

相关文章:

  • Transfomer的本质
  • 【Android】Wallpaper学习
  • 博客系统案例练习2-用户注册-redis
  • 数据库知识
  • 电解电容失效分析过程、失效分析报告
  • 450.删除二叉搜索树中的节点
  • 【Vulkan 入门系列】创建交换链、图像视图和渲染通道(四)
  • 【2025面试常问Java八股】AQS介绍(AbstractQueuedSynchronizer 抽象队列同步器)
  • PyCharm使用Anaconda 中的虚拟环境
  • PowerBi如何制作KPI的总览页?
  • 关于AI:记忆、身份和锁死
  • Function calling LLMs 的 MCP:AI开发的双剑合璧
  • [OpenGL]使用OpenGL实现基于物理的渲染模型PBR(下)
  • 大数据应用开发——大数据平台集群部署(四)
  • 【KWDB 创作者计划】_上位机知识篇---Arduino
  • 什么是 C++中的const?
  • SpringBoot Actuator指标收集:Micrometer与Prometheus集成
  • Matlab 基于模型参考自适应法和SVPWM的异步电机控制
  • `ImadcnIdentifierGenerator` 深度解析
  • Java学习笔记(数组,方法)
  • 广西气象干旱面积97.5%,影响人畜饮水、农业生产
  • 沃尔沃中国公开赛夺冠,这是吴阿顺与上海的十年之约
  • 2025上海半马鸣枪,多个“首次”冲击一城双白金
  • “站在亚洲实现整体振兴的新起点上”——习近平主席对越南、马来西亚、柬埔寨进行国事访问纪实
  • 上海奉贤这所九年一贯制学校将迎首批新生,有何特色?
  • 遭遇FIFA三个转会窗禁令,申花有苦难言将选择赔偿