当前位置：首页 > news >正文

12.FFN基于位置的前馈网络

news 来源：原创 2025/4/22 5:21:43

从入门AI到手写Transformer-12.FFN基于位置的前馈网络

12.FFN基于位置的前馈网络
代码

整理自视频老袁不说话。

12.FFN基于位置的前馈网络

在这里插入图片描述
之间讲了残差连接，规范化。
这节是FFN基于位置的前馈网络，其实就是MLP，两层线性连接层。
输入 $X : [b s, n, d]$
第一层： $Y=XW_1+B_1\quad W1:[d,d_m]$ ，代入 $Y$ ， $Y = R e LU (X)$ ，输出 $Y:[bs,n,d_m]$
第二层： $Y=XW_2+B_2\quad W1:[d_m,d]$ ，输出 $Y : [b s, n, d]$

代码

import torch
from torch import nnclass FFN(nn.Module):# dm=4*ddef __init__(self,d,dm,*args,**kwargs)->None:super(FFN,self).__init__(*args,**kwargs)self.dense1=nn.Linear(d,dm) # weight:[dm,d] bias:[dm]self.relu=nn.ReLU()self.dense2=nn.Linear(dm,d) # weight:[d,dm] bias:[d]def forward(self,X):Y=self.dense1(X)Y=self.relu(Y)Y=self.dense2(Y)return YX=torch.randn(3,5,10)
ffn=FFN(10,40)
o=ffn(X)
print(o.shape)

相关文章：

中华传承-医山命相卜-易经

Linux MySQL版本升级（rpm安装方式）

嵌入式开发--STM32G4系列硬件CRC支持MODBUS和CRC32

mybatisFlex各种链式sql写法

深度比较Gemini 2.5两款最新模型差异

Python基础知识语法归纳总结（数据类型-1）

python_level1.2

Android模块编译无法找到依赖（shared_libs）

【Vue3代理机制详解：从原理到实践】

LeadeRobot具身智能应用标杆：无人机X柔韧具身智能，空中精准作业游刃有余

6. 实战（二）：用Spring AI+OpenAI构建企业级智能客服

STM32学习2

自学新标日第十九课复习版本

驱动移植【简略版】

Vue3中provide和inject的用法示例

第 4 期：DDPM中的损失函数——为什么只预测噪声？

守护进程及gdb调试（新手简略版）

数控铣床自动上下料机械手控制装置设计

python豆包语音合成并播放

keil5软件配置以及使用技巧

石中英已任新成立的清华大学教育学院院长

比起追逐爆款，动画行业更需要打开思路“重塑肉身”

用了半年的洗衣机竟比马桶还脏，别再这样洗衣服了

京东：自21日起，所有超时20分钟以上的外卖订单全部免单

马拉松夺冠机器人将小批量量产：价格与一台入门级小轿车差不多

寻找“香奈儿”代工厂