当前位置：首页 > news >正文

大模型时代的深度学习框架

news 来源：原创 2025/4/26 3:47:05

作者：算力魔方创始人/英特尔创新大使刘力

在CNN时代，AI模型的参数规模都在百万级别，仅需在单张消费类显卡上即可完成训练。例如，以业界知名的CNN模型：ResNet50为例，模型参数量是约为 25.63M，在ImageNet1K数据集上，使用单张消费类显卡RTX-4090只需大约35~40个小时，即可完成ResNet50模型的预训练。

在大模型时代，由于大模型参数规模庞大，无法跟CNN时代的小模型一样在单张显卡上完成训练，需要构建多张AI加速卡的集群才能完成AI大模型的预训练。例如：DeepSeek-V3在其技术报告中介绍，DeepSeek-V3的模型参数量为671B，需要278万8千个H800 GPU小时才能完成预训练，换句话说，在有1万张H800的GPU集群上，需要训练278.8个小时。

包含1万张H800的AI数据中心包括：带H800的服务器节点、网络、存储、电源、散热等，一般来说，总建设预算在15亿美金左右。以从AWS上租用1万张H800为例，每小时的租金大约为12.3万美金/小时。以训练DeepSeek-V3为例，训练效率每提升1%，相当于节约278.8*1%*12.3=34.3万美金，即240万人民币的租金。所以，在大模型时代，如何充分利用分布式的GPU集群算力，是深度学习框架首先需要考虑的点。

要充分利用分布式的GPU集群算力，就需要充分使用复杂的并行策略，包括数据并行、张量并行、参数分片并行、流水线并行、序列并行、专家并行等；并且还要提升GPU与GPU，服务器节点与服务器节点间的通讯效率；除此之外，还要考虑AI数据中心不同算力芯片的适配；前沿模型快速发展时，对新型模型的支持等等...

若要求AI模型科学家既要熟知模型结构，还要深入了解芯片特点、硬件架构、并行策略、调度逻辑等等，这会使得大模型的开发和性能优化的技术门槛变得非常高，大大制约了大模型的开发和训练效率。

针对上述需求和痛点，飞桨新一代框架3.0应运而生，该版本提供了丰富的深度学习相关的各种开发接口：

表示层：专注于计算图的表达与转换，通过高可扩展中间表示PIR，实现动转静、自动微分、自动并行、算子组合以及计算图优化等核心功能；
调度层：负责对代码或计算图进行智能编排与高效调度，支持动态图和静态图两种不同的执行模式；
算子层：由神经网络编译器CINN和算子库PHI共同构成，涵盖了张量定义、算子定义、算子自动融合和算子内核实现等关键功能；
适配层：则用于实现与底层芯片适配，包括设备管理、算子适配、通信适配以及编译接入等功能。

飞桨框架3.0凭借强大的功能和优化的设计，帮助算法工程师和科研人员以更低的成本进行算法创新，并实现产业应用。以百度文心大模型为例，飞桨框架3.0在训练、推理等方面为文心大模型提供端到端优化，训练方面重点提升训练吞吐、训练有效率和收敛效率，集群训练有效率超过98%；推理部署方面通过注意力机制量化推理、通用投机解码等技术提升推理吞吐和效率；全面支持文心4.5、文心X1等大模型的技术创新和产业应用。

飞桨框架3.0 Github仓：https://github.com/PaddlePaddle/Paddle。

如果你有更好的文章，欢迎投稿！

稿件接收邮箱：nami.liu@pasuntech.com

更多精彩内容请关注“算力魔方®”！

uni-app 小程序中的定位问题以及页面安全距离

基于DrissionPage的表情包爬虫实现与解析（含源码）

解释一下计算机中的内存对齐

【Django】新增字段后兼容旧接口 This field is required

【防火墙 pfsense】3 portal

Docker容器持久化

博雷顿IPO点燃新能源机械市场，金众诚如何优化项目盈利

SOC估算：开路电压修正的安时积分法

Mybatis-Plus，IDEA2024版本

gerbera文件转PCB文件-Altium Designer

windows作业job介绍

基于归纳共形预测的大型视觉-语言模型中预测集的**数据驱动校准**

用Obsidian四个插件打造小说故事关联管理系统：从模板到图谱的全流程实践

金仓数据库KingbaseES技术实践类深度剖析与实战指南

【Dify系列教程重置精品版】第1课相关概念介绍

Python图像变清晰与锐化，调整对比度，高斯滤波除躁，卷积锐化，中值滤波钝化，神经网络变清晰

PR第二课--混剪

Float32、Float16、BFloat16

第一部分：git基本操作

Java基础第四章、面向对象

财政部部长蓝佛安：中国将采取更加积极有为的宏观政策

新华时评：坚定不移办好自己的事，着力抓好“四稳”

印媒称印巴在克什米尔控制线沿线发生小规模交火，巴方暂未回应

涉军民事案件类型日益增多，最高法新规明晰管辖争议问题

财政部部长：中方主张通过平等对话协商解决贸易和关税争议

水利部启动实施蓄滞洪区建设管理三年行动

相关文章：