当前位置：首页 > news >正文

CentOS7 部署 Ollama 全栈指南：构建安全远程大模型服务

news 来源：原创 2025/4/27 8:43:02

一、基础环境配置

1. 系统升级与依赖安装

# 更新系统组件
sudo yum update -y
sudo yum install -y epel-release
sudo yum groupinstall "Development Tools" -y# 安装 Python3 环境
sudo yum install python3 python3-devel python3-pip -y
python3 -m pip install --upgrade pip

2. GLIBC 版本验证

CentOS7 默认 GLIBC 版本为 2.17，需升级至 2.27+ 以兼容 Ollama：

# 安装 SCL 软件集
sudo yum install centos-release-scl -y
sudo yum install devtoolset-12 -y# 激活新环境
scl enable devtoolset-12 bash
echo "source /opt/rh/devtoolset-12/enable" >> ~/.bashrc

二、Ollama 服务部署

1. 二进制安装

# 执行官方安装脚本
curl -fsSL https://ollama.com/install.sh | sh# 验证安装
ollama --version  # 应显示 v0.5.12+

2. 模型部署示例

启动 70 亿参数的中文模型：

ollama run wangshenzhi/llama3-8b-chinese-chat-ollama-q8

三、远程访问配置

1. 服务监听地址修改

# 编辑服务配置文件
sudo vi /etc/systemd/system/ollama.service# 在 [Service] 段添加环境变量
Environment="OLLAMA_HOST=0.0.0.0:11434"# 重载配置并重启
sudo systemctl daemon-reload
sudo systemctl restart ollama

2. 防火墙规则配置

# 开放 11434 端口
sudo firewall-cmd --permanent --add-port=11434/tcp
sudo firewall-cmd --reload# 验证端口监听
netstat -tuln | grep 11434  # 应显示 LISTEN 状态

四、安全加固方案

1. Nginx 反向代理

server {listen 443 ssl;server_name your-domain.com;ssl_certificate /path/to/cert.pem;ssl_certificate_key /path/to/key.pem;location / {proxy_pass http://127.0.0.1:11434;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;}# IP 白名单控制allow 192.168.1.0/24;deny all;
}

2. API 密钥认证

通过中间件实现请求头校验：

from fastapi import FastAPI, Header, HTTPExceptionapp = FastAPI()
API_KEY = "your_secure_key_here"@app.middleware("http")
async def verify_key(request, call_next):if request.headers.get("X-API-Key") != API_KEY:raise HTTPException(status_code=401, detail="Unauthorized")return await call_next(request)

五、Python 远程调用实践

1. 基础文本生成

import requestsdef generate_text(prompt):url = "http://your-server-ip:11434/api/generate"data = {"model": "llama3-8b-chinese","prompt": prompt,"stream": False}response = requests.post(url, json=data)return response.json()["response"]# 示例调用
result = generate_text("量子纠缠的基本原理是什么？")
print(result)

2. 流式响应处理

def stream_generation(prompt):response = requests.post("http://your-server-ip:11434/api/generate",json={"model": "llama3-8b-chinese", "prompt": prompt, "stream": True},stream=True)for chunk in response.iter_lines():if chunk:data = json.loads(chunk.decode('utf-8'))if not data["done"]:yield data["response"]# 实时输出
for text in stream_generation("编写Python快速排序代码"):print(text, end='', flush=True)

六、生产环境问题排查

1. GLIBC 版本冲突

若出现 libstdc++.so.6: version GLIBCXX_3.4.20 not found 错误：

# 查看当前 GLIBCXX 版本
strings /usr/lib64/libstdc++.so.6 | grep GLIBCXX# 手动升级 libstdc++
sudo yum install devtoolset-12-libstdc++-devel -y

2. 模型加载异常

通过日志诊断资源问题：

journalctl -u ollama -f  # 实时监控服务日志
free -h  # 检查内存占用
nvidia-smi  # 查看 GPU 状态

结语

通过本文的配置方案，开发者可在 CentOS7 上构建稳定的大模型服务端，并通过标准 HTTP 协议实现安全远程调用。建议定期执行 ollama update 保持模型版本最新，同时关注 CVE 漏洞公告及时修补安全风险。对于企业级场景，可结合 Kubernetes 实现高可用集群部署。

Eigen线性代数求解器（分解类）

代码随想录算法训练营Day31 | 56. 合并区间 738.单调递增的数字

代码随想录算法训练营第二十七天(补)

ABAP Object Services

通过gap看margin和padding在布局中的应用

多个请求并行改造

人工智能：入门阶段学习路径

使用Xshell中自带的传输新建文件功能实现上传下载文件

PCL点云处理之基于FPFH特征的SAC-IA全局配准算法（二百四十六）

gin框架学习笔记

C++篇——继承

04_jQuery

4-26记录（学习通排序测试）

TDengine 中的压缩设计

springboot入门-repository数据访问层JPA和mybatis

NtripShare 2025第一季度主要技术进展

Python循环结构深度解析与高效应用实践

2.4goweb项目上传到csdn的git仓库

SinSR模型剪枝实验报告

蓝桥杯赛场反思：技术与心态的双重修炼

俄罗斯称已收复库尔斯克州，普京发表讲话

阿联酋启动第三届全球航空奖评选，奖金总额达百万美元

毕节两兄弟摘马蜂窝致路人被蜇去世，涉嫌过失致人死亡罪被公诉

“雷公”起诉人贩子王浩文案开庭：庭审前手写道歉信，庭审中不承认拐走川川

中国工程院院士、歼八Ⅱ飞机系统工程副总设计师温俊峰逝世

小米首次参加上海车展：没有雷军依旧人气爆棚，YU7上市时间未推迟