当前位置: 首页 > news >正文

Cherry Studio搭建本地知识库,结合DeepSeek实现RAG

Cherry Studio搭建本地知识库,结合DeepSeek实现RAG

  • CherryStudio
    • CherryStudio 简介
    • 环境准备
  • 模型配置
  • 本地知识创建
    • 1、新建知识库
    • 2、添加文件
    • 3、添加网址或者网站
    • 4、搜索知识库
  • 结合DeepSeek实现RAG
    • 1、选择知识库
    • 2、进行提问
  • 常见问题与解决方案

CherryStudio

CherryStudio 简介

CherryStudio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台。 CherryStudio 的高度自定义的设计、强大的扩展能力和友好的用户体验,使其成为专业用户和 AI 爱好者的理想选择。无论是零基础用户还是开发者,都能在 CherryStudio 中找到适合自己的AI功能,提升工作效率和创造力。

CherryStudio

今天就体验一下 CherryStudio 搭建本地知识库,并使用 DeepSeek 实现 RAG 功能。

多数据源知识库

环境准备

在搭建本地知识库前,需要确保以下环境准备到位:

  • 操作系统要求:支持 Windows、macOS、Linux 平台。
  • 安装 Cherry Studio
    1. 前往 Cherry Studio 官方网站 下载最新版本客户端。
    2. 按照安装向导完成部署。

模型配置

知识库需要配置嵌入模型,而实现 RAG 需要使用到大模型如 DeepSeek-R1,为了方便,我们可以直接使用硅基流动提供的 API 能力,毕竟点击新注册的账号有免费的 2000W Tokens 还没用完。

硅基流动

注册之后可以复制出来API Key,粘贴到Cherry Studio中去。

复制出来API Key

在 Cherry Studio 设置->模型服务->硅基流动,按如下顺序进行配置:

  1. 正确配置硅基流动的配置: API 地址【https://api.siliconflow.cn】和 API Key【sk-a·············bcqb】,如果有其他模型的 API Key 也可以直接选择其他模型。
  2. 选择嵌入模型:用于向量化知识,并存入向量数据库,免费的嵌入模型可以用 BAAI/bge-m3,为了效果更好可以选择付费的 Pro/BAAI/bge-m3
  3. 选择对话模型:用于 RAG 功能实现对话,我们选择当前 DeepSeek-R1 或 DeepSeek-V3。

Cherry Studio设置模型

本地知识创建

1、新建知识库

点击 Cherry Studio 左侧知识库按钮,进入知识库管理页面,点击添加按钮新建知识库。

添加知识库

新建知识库

2、添加文件

支持拖拽添加本地文件,也可以添加本地文件目录、网址、网站或者文本。

添加本地文件

3、添加网址或者网站

可以将网络上的内容添加到知识库中,如某一篇博客内容,也可以将一个网站进行添加,如将本人博客网站添加到知识库,需要注意的是正确填写网站的站点地图

添加网址或者网站

4、搜索知识库

可以在本地知识库中进行内容搜索,能够检索到相关内容片段,这些内容片段后面通过 RAG 技术,将作为提问的上下文传给 LLM。

搜索知识库

结合DeepSeek实现RAG

RAG (Retrieval-Augmented Generation) 是一种将信息检索和生成结合起来的技术架构。在自然语言处理领域,RAG 通过检索相关的外部知识库内容,结合生成式模型生成最终的答案,能够极大地提升模型的回答准确性和丰富性。

本地知识库的搭建则是 RAG 技术的重要部分,利用 Cherry Studio 等平台,可以便捷地实现这一过程。

1、选择知识库

进行提问之前可以选择要检索的知识库。

选择知识库

2、进行提问

可以看到大模型回答内容时参考了知识库中本人网站的内容:

进行提问

常见问题与解决方案

Q: Cherry Studio 能否支持动态更新数据?

A: 支持。可以增量更新文档,系统会自动重建索引。

Q: 是不是需要联网才能使用?

A: 搭建本地知识库支持完全离线运行,对话模型需要联网。

Q: Cherry Studio 的检索速度如何?

自动重建索引。

Q: 是不是需要联网才能使用?

A: 搭建本地知识库支持完全离线运行,对话模型需要联网。

Q: Cherry Studio 的检索速度如何?

A: 对于中小规模知识库,其内置检索引擎性能较优。此外,结合向量化检索技术可以进一步提升速度。

相关文章:

  • AM32-MultiRotor-ESC项目固件编译和烧录方法介绍
  • 【Spring】Spring框架介绍
  • C/C++蓝桥杯算法真题打卡(Day7)
  • 生物化学笔记:医学免疫学原理03 超抗原+丝裂原+疫苗佐剂
  • BLE 4.0开发技术全景解析
  • [自动化] 【八爪鱼】使用八爪鱼实现CSDN文章自动阅读脚本
  • (自用)在派上设置自启动时的问题
  • 0323-哈夫曼数、哈夫曼编码
  • proteus仿真stm32f103c8程序运行不起来的问题分析与解决
  • Jboss漏洞再现
  • C51知识点
  • 代码随想录算法训练营第十五天|右旋字符串
  • Linux的文件上传下载的lrzsz库的安装与使用
  • 《当人工智能遇上广域网:跨越地理距离的通信变革》
  • 08_双向循环神经网络
  • React 中useMemo和useCallback Hook 的作用,在什么场景下使用它们?
  • 图书管理系统系统-Java、SpringBoot、Vue和MySQL开发的图书馆管理系统
  • 文心快码 使用体验与介绍
  • 分布式算法:Paxos Raft 两种共识算法
  • 结合代码理解Spring AOP的概念(切面、切入点、连接点等)
  • 幸福航空五一前三天航班取消:客服称目前是锁舱状态,无法确认何时恢复
  • 滨江集团去年营收约691亿元,尚未结算的预收房款1253亿元
  • 商务部:将积极会同相关部门加快推进离境退税政策落实落地
  • 百岁太极拳大师、陈氏太极拳第十一代嫡宗传人陈全忠逝世
  • 六部门:进一步优化离境退税政策扩大入境消费
  • 锚定“双一流”战略坐标,福建农林大学向全球英才“伸出橄榄枝”