当前位置：首页 > news >正文

PyTorch卷积层填充（Padding）与步幅（Stride）详解及代码示例

news 来源：原创 2025/4/23 5:14:46

本文通过具体代码示例讲解PyTorch中卷积操作的填充（Padding）和步幅（Stride）对输出形状的影响，帮助读者掌握卷积层的参数配置技巧。

一、填充与步幅基础

填充（Padding）：在输入数据边缘添加指定数量的像素，用于控制输出尺寸的大小。
步幅（Stride）：卷积核在输入数据上每次滑动的步长，用于控制输出尺寸的缩小比例。

输出尺寸计算公式：

二、代码实现与示例

1. 全侧边填充1个像素

import torch
from torch import nndef comp_conv2d(conv2d, x):x = x.reshape((1, 1) + x.shape)  # 增加批次和通道维度y = conv2d(x)                    # 计算卷积return y.reshape(y.shape[2:])    # 删除批次和通道维度# 创建卷积层：3x3卷积核，填充1像素
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1)
x = torch.rand((8, 8))               # 8x8输入矩阵
comp_conv2d(conv2d, x).shape         # 输出形状

输出结果：

torch.Size([8, 8])

解析：填充1像素后，输入尺寸保持不变。

2. 非对称填充（高度和宽度不同）

# 创建卷积层：5x3卷积核，高度填充2，宽度填充1
conv2d = nn.Conv2d(1, 1, kernel_size=(5, 3), padding=(2, 1))
comp_conv2d(conv2d, x).shape

输出结果：

torch.Size([8, 8])

3. 步幅设置为2

# 创建卷积层：3x3卷积核，填充1，步幅2
conv2d = nn.Conv2d(1, 1, kernel_size=3, padding=1, stride=2)
comp_conv2d(conv2d, x).shape

输出结果：

torch.Size([4, 4])

4. 复杂参数组合

# 创建卷积层：3x5卷积核，高度不填充，宽度填充1，步幅(3,4)
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
comp_conv2d(conv2d, x).shape

输出结果：

torch.Size([2, 2])

三、总结

填充用于保持输入输出尺寸一致或调整边缘特征保留。
步幅用于降低输出尺寸，减少计算量。
通过组合不同参数，可灵活控制卷积层的输出形状。

建议读者通过修改参数自行实验，深入理解公式中的数值变化规律。

深入理解 Spring @Configuration 注解

PyTorch深度学习框架60天进阶学习计划 - 第48天：移动端模型优化（二）

4.22tx视频后台开发一面

【愚公系列】《Python网络爬虫从入门到精通》063-项目实战电商数据侦探（主窗体的数据展示）

前端框架的“快闪“时代：我们该如何应对技术迭代的洪流？

媒体关注：联易融聚焦AI+业务，重塑供应链金融生态

CAD在线查看免费，可以支持DWG/GLB/GLTF/doc/wps/pdf/psd/eml/zip, rar/MP3/MP4/svg/OBJ/FBX格式

2025年数字媒体设计与文化交流国际会议 (DMACE 2025)

【Redis】字符串类型List 常用命令详解

基于 PaddleOCR对pdf文件中的文字提取

分布式之易混淆概念

vue浅试（1）

EasyRTC音视频实时通话：打造高清低延迟的远程会议新生态

（51单片机）LCD显示温度（DS18B20教程）（LCD1602教程）（延时函数教程）（单总线教程）

7. 深入Spring AI：刨析 Advisors 机制

C++中的算术转换、其他隐式类型转换和显示转换详解

极验4滑块笔记：整理思路--填坑各种问题

Java--数组的应用

Linux随记（十七）

辛格迪客户案例 | 浙江高跖医药委托生产质量管理协同(OWL MAH)项目

俄总理：2024年俄罗斯GDP增长4.3%

印控克什米尔发生恐袭事件，外交部：中方反对一切形式的恐怖主义

重庆市委原常委、政法委原书记陆克华严重违纪违法被开除党籍和公职

浙江严禁中小学节假日集体补课，省市县教育部门公布举报电话

神二十6个半小时到站

一场12年的马拉松，他用声音陪伴中国路跑成长

一、填充与步幅基础

二、代码实现与示例

1. 全侧边填充1个像素

2. 非对称填充（高度和宽度不同）

3. 步幅设置为2

4. 复杂参数组合

三、总结

相关文章：