当前位置: 首页 > news >正文

[特殊字符] 当Docker遇上大模型:本地运行LLM的奇幻漂流 [特殊字符]

🔍 你绝对没听过的Docker新玩法!

使用Docker在本地运行大型语言模型(LLMs)?没错,这不是科幻小说!Docker现在不仅能跑容器,还能通过Docker Model Runner让你和LLM来场"面对面"聊天~

💡 开发者们注意啦!GenAI开发再也不是高门槛游戏了。Docker又一次施展魔法,把复杂的AI模型变得像"docker run"一样简单!


✨ Docker Model Runner的四大超能力

  1. 🧑‍💻 开发者友好

    • 告别工具链混乱!用熟悉的Docker命令就能玩转AI模型

    • 学习曲线?不存在的~

  2. ⚡ GPU加速狂飙

    • Apple Silicon用户福音!直接调用Metal API实现GPU加速

    • llama.cpp在主机上火力全开

  3. 💾 OCI存储黑科技

    • 模型不再塞进Docker镜像

    • 采用行业标准OCI格式,省空间又高效

  4. 🔒 本地化隐私堡垒

    • 再也不用担心云API的限速/天价账单

    • 数据安全牢牢掌握在自己手中


🛠️ 准备工作:3步启动魔法引擎

  1. 安装Docker Desktop ≥v4.40 (Apple Silicon芯片的Mac专属福利哦~)

  2. 开启隐藏技能 设置 > Features in development里勾选:

    • ✅ Enable Docker Model Runner

    • ✅ Enable host-side TCP support(API功能需要)

  3. 验证安装 终端输入docker model,看到命令列表就说明准备就绪啦!


🎮 两种玩法任你选

玩法1️⃣:CLI聊天模式(适合新手)

# 拉取llama3.2模型(像拉镜像一样简单!)
docker model pull ai/llama3.2
​
# 启动对话模式
docker model run ai/llama3.2

输入/bye即可优雅退场~ ✌️


玩法2️⃣:API高级模式(OpenAI兼容)

🐳 容器内访问

基础URL:http://model-runner.docker.internal

curl http://model-runner.docker.internal/v1/chat/completions \-H "Content-Type: application/json" \-d '{"model": "ai/llama3.2","messages": [{"role": "system", "content": "你是个毒舌助手"},{"role": "user", "content": "用四川话夸夸Docker"}]}'
💻 主机访问

基础URL:http://localhost:12434

curl http://localhost:12434/v1/chat/completions \-H "Content-Type: application/json" \-d '{"model": "ai/llama3.2","messages": [{"role": "system", "content": "你是个喵星人"},{"role": "user", "content": "用猫语解释Docker原理"}]}'

🌟 响应示例(JSON格式)

{"model": "ai/llama3.2","choices": [{"message": {"content": "Docker嘛,就像喵星人的纸箱子...","role": "assistant"}}],"usage": {"prompt_tokens": 20,"completion_tokens": 87}
}

🚨 重要提示

  • 目前仅支持Apple Silicon芯片的Mac

  • 大模型下载需要耐心(建议泡杯☕️等待)

  • TCP模式开启后才能玩转API

  • 模型存储在~/.docker/run/models目录


🎉 未来值得期待

Docker团队正在加班加点开发:

  • 更多模型支持

  • Windows/Linux版本

  • 更丰富的管理命令

  • 可视化监控界面


🌈 开发者们,是时候在本地开启你的AI冒险了! 不用云API、不怕数据泄露,就像运行容器一样简单地驾驭大模型,这才是真正的"CLI魔法"啊!✨

相关文章:

  • 68.评论日记
  • 使用dompurify修复XSS跨站脚本缺陷
  • ABAP OLE
  • 一次制作参考网杂志的阅读书源的实操经验总结(附书源)
  • 残差连接缓解梯度消失的含义;残差连接的真正含义:F(x) = y - x ;y=F(x)+x
  • IE之路专题12.BGP专题
  • ES中常用的Query和查询作用,以及SpringBoot使用实例
  • volatile的进一步深入理解
  • 如何导出pip下载的paho-mqtt包
  • 对比说明Navicat for MySQL和DBeaver的数据同步功能
  • Qt QTimer 详解与使用指南
  • VueRouter笔记
  • LeetCode 2364.统计坏数对的数目:反向统计
  • 深度学习3.2 线性回归的从零开始实现
  • (8)VTK C++开发示例 --- 交互式3D部件
  • VTK9 编译
  • Android 12.0 framework实现对系统语言切换的功能实现
  • Dubbo Filter如何实现Bean注入与配置文件读取?
  • 花园灌溉问题
  • 若依框架修改左侧菜单栏默认选中颜色
  • 告别国泰海通,黄燕铭下一站将加盟东方证券,负责研究业务
  • 湘江半程马拉松赛女配速员“跑崩”,晕倒在终点?组委会回应
  • 受贿超8.22亿元,新疆维吾尔自治区党委原副书记李鹏新一审被判死缓
  • 智飞生物一季度营收下滑79%,连续三个季度亏损,称业绩波动与行业整体趋势一致
  • “女孩被前男友泼汽油烧伤致残案”二审择期宣判
  • 在因关税战爆火的敦煌网上,美国人爱买什么中国商品