《AI大模型开发笔记》——企业RAG技术实战
RAG(Retrieval-Augmented Generation)介绍
Retrieval-Augmented Generation for Large Language Models: A Survey: https://arxiv.org/abs/2312.10997
github项目: https://github.com/Tongji-KGLLM/RAG-Survey
RAGFlow项目
ragflow项目地址: https://github.com/infiniflow/ragflow
环境配置
wsl安装
安装 WSL文档: https://learn.microsoft.com/zh-cn/windows/wsl/install
WSL基本命令: https://learn.microsoft.com/zh-cn/windows/wsl/basic-commands
1、管理员权限打开powershell命令
#启动wsl子系统
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux
/all /norestart
#启用虚拟机平台支持
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all
/norestart
#设置wsl2
wsl --set-default-version 2
也可以手动选择:
docker环境安装
下载安装路径: https://docs.docker.com/engine/install/
设置镜像本地路径
默认镜像拉取到本地后会保存在c:盘,我们设置到其它路径
设置镜像源
国外镜像源拉取比较慢,更新成国内镜像源
测试docker是否正常
#cmd运行命令
docker run hello-world
#会拉取下来一个测试的hello-world镜像, 在对应设置的镜像目录下也会看到, docker界面的
安装运行RAGFlow
ragflow项目地址: https://github.com/infiniflow/ragflow
git把代码拉取下来
git clone https://github.com/infiniflow/ragflow.gi
拉取代码后:
#cmd命令行切换到 ragflow\docker下,然后运行下面命令, 一键自动下载项目的依赖镜像和环境
docker compose -f docker-compose-CN.yml up -d
请注意,运行上述命令会自动下载 RAGFlow 的开发版本 docker 镜像。如果你想下载并运行特定版本的 docker 镜像,请在 docker/.env 文件中找到 RAGFLOW_VERSION 变量,将其改为对应版本。例如 RAGFLOW_VERSION=v0.10.0,这个版本就是github的代码版本,然后运行上述命令。
核心镜像文件大约 9 GB,可能需要一定时间拉取。请耐心等待
这个过程会要一段时间,请耐心等待
启动
服务器启动成功后再次确认服务器状态:
docker logs -f ragflow-server
出现以下界面提示说明服务器启动成功:
如果您跳过这一步系统确认步骤就登录 RAGFlow,你的浏览器有可能会提示 network abnormal
或 网络异常 ,因为 RAGFlow 可能并未完全启动成功。
登录
下面网站和端口即可打开系统
http://127.0.0.1:80
按照提示注册登录即可
建立知识库与聊天
模型配置
正常我们选择本地ollama部署的大语言模型
#默认的ollama是这个端口
http://127.0.0.1:11434
#项目是windows的docker启动, 则使用
http://host.docker.internal:11434/
#模型
qwen2:7b-instruct-q4_0
界面演示如下
建立知识库
上传一个本地文件,一定要把文件解析好
新建助理时ÿ