当前位置：首页 > news >正文

【深度学习】评估模型复杂度：GFLOPs与Params详解

news 来源：原创 2025/4/29 15:17:56

评估模型复杂度：GFLOPs与Params详解

在深度学习模型设计与优化过程中，GFLOPs和Params是论文中两个重要的评估指标，它们分别衡量模型的计算复杂度和参数量。本文将详细介绍这两个概念及其在实践中的应用。

1. Params：模型参数量

1.1 基本概念

Params（Parameters）指的是神经网络模型中所有可训练参数的总数量。这些参数包括：

卷积层的权重和偏置
全连接层的权重和偏置
归一化层的可学习参数（如BatchNorm的 $γ$ 和 $β$ ）

1.2 计算方法

不同层的参数量计算方式：

全连接层：输入维度 × 输出维度 + 输出维度（偏置）
卷积层：(kernel_height × kernel_width × in_channels) × out_channels + out_channels（偏置）
BatchNorm层：2 × channels（ $γ$ 和 $β$ 各一个）

1.3 代码示例（PyTorch）

import torch
import torch.nn as nndef count_params(model):return sum(p.numel() for p in model.parameters() if p.requires_grad)# 示例模型
model = nn.Sequential(nn.Conv2d(3, 16, kernel_size=3),nn.ReLU(),nn.Flatten(),nn.Linear(16*26*26, 10)
)print(f"模型参数量: {count_params(model):,}")

2. FLOPs与GFLOPs：浮点运算次数

2.1 基本概念

FLOPs（Floating Point Operations）：浮点运算次数
GFLOPs：10^9 FLOPs（十亿次（G,吉， $1G = 10^9$ ）浮点运算）

FLOPs衡量的是模型执行一次前向传播所需的浮点运算总量，反映了模型的计算复杂度。

2.2 计算方法

常见层的FLOPs计算：

全连接层：(2 × in_features - 1) × out_features
卷积层：2 × H_out × W_out × in_channels × out_channels × kernel_height × kernel_width
激活函数：通常忽略或按元素计算

2.3 代码示例

def count_flops(model, input_size=(1, 3, 32, 32)):from thop import profileinput = torch.randn(input_size)flops, params = profile(model, inputs=(input,))return flopsprint(f"模型FLOPs: {count_flops(model)/1e9:.2f} GFLOPs")

3. 两者的关系与区别

特性	Params	FLOPs/GFLOPs
衡量对象	模型容量/存储需求	计算复杂度/运行速度
单位	数量（通常百万，M）	浮点运算次数（十亿，G）
影响因素	网络宽度/深度	输入分辨率/网络结构
优化方向	参数量压缩	计算加速