当前位置: 首页 > news >正文

【开发心得】Dify部署ollama模型的坑[8]

目录

关于一体机

关于特斯拉

AI显卡与游戏显卡

总结 


目前我们的私有化部署已经来到了32B的大模型,场景落地了。

在继续评估之前,来说点儿关于硬件的坑。

关于一体机

市面上,一体机很火,不怀疑一体机的算力,也不怀疑一体机的部署门槛,但是对于一体机在场景落地以后的优化和维护存在疑问,不过这个不是今天的主题,下次再聊。

先说说我们的选择,采用了公有云的私有化部署方案,读起来有点儿拗口,简单的说,就是算力与一体机类似,外网是无法访问的,知识库也是私有化的,并不对外公开。

关于特斯拉

重点来说说GPU,之前的文章里,都是不带GPU的,这次真的是有钱了,买了4卡的GPU,型号是特斯拉L2,虽然比不上A100(美国也不让我们用),但是也算是中端AI计算卡了,性能用下来,感觉还不错。

AI显卡与游戏显卡

当时在讨论硬件方案的过程中,有人就问,AI用的GPU与游戏显卡的区别是什么?

今天就把这个问题搞清楚,首先需要说明的是,如果你在家里自己玩,用带游戏显卡的笔记本,都可以部署一个14B的模型,而且效果也不错,网上的很多收费视频都是采用了这种方式。

企业级的话,游戏显卡就有点儿马拉火车的感觉了,不废话,直接上表格对比吧。

维度AI显卡游戏显卡
核心架构强化Tensor Core/CUDA,高并行计算优化RT Core,强调实时渲染
显存类型HBM2/HBM3,高带宽低延迟GDDR6X,侧重纹理加载速度
典型应用深度学习、科学计算3A游戏、VR内容创作
扩展能力支持多卡互联(NVLink)多屏输出为主(SLI/CrossFire)
价格区间企业级(10万+)消费级(2000-15000元)
代表型号英伟达A100/H100技嘉RTX 5060 Ti、RTX 4090
适用场景优先级科研/商用 > 娱乐娱乐 > 轻度专业应用

假入你家里的游戏电脑配置还算可以,也可以本地部署一个,可以把电脑里的各类攻略搞一个知识库,至少在游戏阶段,也可以少踩很多坑。

维度游戏显卡方案专业AI显卡方案
显存成本RTX 5090D(32GB)约1.5万元,性价比较高‌27A100/H100(80GB)单卡超10万元‌26
部署复杂度需手动配置多卡互联与模型压缩,适合技术型用户‌58支持NVLink多卡扩展,企业级工具链完善‌68
适用场景个人开发者/小型团队测试、轻量级AI应用‌58大规模模型训练、商用高并发需求‌26

总结 

照例还是总结一下,在人工智能领域,目前是符合Scaling Law(扩展定律)的,是指模型的性能与其规模(如数据量、参数数量、计算资源等)之间的经验性数学关系。简单来说,它描述了“更大规模通常带来更好性能”的规律,但并非简单的线性增长,而是遵循特定的非线性模式。上不封顶,个体而言,利用现有资源做更多的事情,是值得思考和实践的。

相关文章:

  • 【后端】【python】Python 爬虫常用的框架解析
  • Python字典深度解析:高效键值对数据管理指南
  • 在统信UOS1060中将MP3MP4格式转换为Ogg Vorbis格式
  • 基于autoware.1.14与gazebo联合仿真进行Hybrid A* 算法规划控制代价地图版
  • websocket和SSE学习记录
  • 使用Spring Validation实现参数校验
  • Step文件无法编辑怎么办?
  • System.in 详解
  • 个人自用-导入安装Hexo
  • Java 内存优化:如何避免内存泄漏?
  • React-useImperativeHandle (forwardRef)
  • CRT(阴极射线管)终端控制器
  • 手动实现LinkedList
  • 【算法数据结构】leetcode37 解数独
  • Unreal 从入门到精通之如何接入MQTT
  • 代码审计入门 原生态sql注入篇
  • 事件冒泡与捕获
  • LeetCode 438 找到字符串中所有字母异位词
  • C语言学习之预处理指令
  • 定制一款国密浏览器(9):SM4 对称加密算法
  • “75后”新任四川泸州市委副书记张伟,已任市政府党组书记
  • 西藏艺术来到黄浦江畔,“隐秘之门”艺术展外滩三号开幕
  • 美国防部宣布整合驻叙美军部队,将减少至不足千人
  • 江苏银行去年净赚超318亿增超10%,不良贷款率持平
  • 祥源文旅:2024年营业收入约8.64亿元,今年旅游经济总体预期更为乐观
  • 嘉兴乌镇一化工公司仓库火灾后,当地召开火灾警示现场会