当前位置：首页 > news >正文

rag搭建，是如何进行向量匹配检索的？

news 来源：原创 2025/4/21 12:50:06

RAG 里为什么要“向量检索”？

在 Retrieval-Augmented Generation (RAG) 中，我们的目标是让 LLM 能够“回答它本身不知道的内容”。做法是：

将知识（文本）进行向量化，存入向量数据库；
用户提问后，也将问题向量化；
去数据库里 找出与这个问题最相似的一批知识，返回喂给 LLM。

向量匹配检索：原理解析

第一步：构建向量数据库（也叫“知识库”）

比如你有一大段文档，做法是：

切分成 chunk（段落），如每 300 字为一个段；
每个 chunk 用 Embedding 模型（如 OpenAI 的 text-embedding-ada-002 或 BGE） 转成一个向量：
```
"向量" = 文本的语义表示，一个高维空间中的点。
```
把每个向量连带元信息&#x

相关文章：

Transfomer的本质

【Android】Wallpaper学习

博客系统案例练习2-用户注册-redis

数据库知识

电解电容失效分析过程、失效分析报告

450.删除二叉搜索树中的节点

【Vulkan 入门系列】创建交换链、图像视图和渲染通道（四）

【2025面试常问Java八股】AQS介绍（AbstractQueuedSynchronizer 抽象队列同步器）

PyCharm使用Anaconda 中的虚拟环境

PowerBi如何制作KPI的总览页？

关于AI：记忆、身份和锁死

Function calling LLMs 的 MCP：AI开发的双剑合璧

[OpenGL]使用OpenGL实现基于物理的渲染模型PBR（下）

大数据应用开发——大数据平台集群部署（四）

【KWDB 创作者计划】_上位机知识篇---Arduino

什么是 C++中的const？

SpringBoot Actuator指标收集：Micrometer与Prometheus集成

Matlab 基于模型参考自适应法和SVPWM的异步电机控制

`ImadcnIdentifierGenerator` 深度解析

Java学习笔记（数组，方法）

广西气象干旱面积97.5%，影响人畜饮水、农业生产

沃尔沃中国公开赛夺冠，这是吴阿顺与上海的十年之约

2025上海半马鸣枪，多个“首次”冲击一城双白金

“站在亚洲实现整体振兴的新起点上”——习近平主席对越南、马来西亚、柬埔寨进行国事访问纪实

上海奉贤这所九年一贯制学校将迎首批新生，有何特色？

遭遇FIFA三个转会窗禁令，申花有苦难言将选择赔偿