当前位置: 首页 > news >正文

12.FFN基于位置的前馈网络

从入门AI到手写Transformer-12.FFN基于位置的前馈网络

  • 12.FFN基于位置的前馈网络
  • 代码

整理自视频 老袁不说话 。

12.FFN基于位置的前馈网络

在这里插入图片描述
之间讲了残差连接,规范化。
这节是FFN基于位置的前馈网络,其实就是MLP,两层线性连接层。
输入 X : [ b s , n , d ] X:[bs,n,d] X:[bs,n,d]
第一层: Y = X W 1 + B 1 W 1 : [ d , d m ] Y=XW_1+B_1\quad W1:[d,d_m] Y=XW1+B1W1:[d,dm],代入 Y Y Y Y = R e L U ( X ) Y=ReLU(X) Y=ReLU(X),输出 Y : [ b s , n , d m ] Y:[bs,n,d_m] Y:[bs,n,dm]
第二层: Y = X W 2 + B 2 W 1 : [ d m , d ] Y=XW_2+B_2\quad W1:[d_m,d] Y=XW2+B2W1:[dm,d],输出 Y : [ b s , n , d ] Y:[bs,n,d] Y:[bs,n,d]

代码

import torch
from torch import nnclass FFN(nn.Module):# dm=4*ddef __init__(self,d,dm,*args,**kwargs)->None:super(FFN,self).__init__(*args,**kwargs)self.dense1=nn.Linear(d,dm) # weight:[dm,d] bias:[dm]self.relu=nn.ReLU()self.dense2=nn.Linear(dm,d) # weight:[d,dm] bias:[d]def forward(self,X):Y=self.dense1(X)Y=self.relu(Y)Y=self.dense2(Y)return YX=torch.randn(3,5,10)
ffn=FFN(10,40)
o=ffn(X)
print(o.shape)

相关文章:

  • 中华传承-医山命相卜-易经
  • Linux MySQL版本升级(rpm安装方式)
  • 嵌入式开发--STM32G4系列硬件CRC支持MODBUS和CRC32
  • mybatisFlex各种链式sql写法
  • 深度比较Gemini 2.5两款最新模型差异
  • Python基础知识语法归纳总结(数据类型-1)
  • python_level1.2
  • Android模块编译无法找到依赖(shared_libs)
  • 【Vue3代理机制详解:从原理到实践】
  • LeadeRobot具身智能应用标杆:无人机X柔韧具身智能,空中精准作业游刃有余
  • 6. 实战(二):用Spring AI+OpenAI构建企业级智能客服
  • STM32学习2
  • 自学新标日第十九课复习版本
  • 驱动移植【简略版】
  • Vue3中provide和inject的用法示例
  • 第 4 期:DDPM中的损失函数——为什么只预测噪声?
  • 守护进程及gdb调试(新手简略版)
  • 数控铣床自动上下料机械手控制装置设计
  • python豆包语音合成并播放
  • keil5软件配置以及使用技巧
  • 石中英已任新成立的清华大学教育学院院长
  • 比起追逐爆款,动画行业更需要打开思路“重塑肉身”
  • 用了半年的洗衣机竟比马桶还脏,别再这样洗衣服了
  • 京东:自21日起,所有超时20分钟以上的外卖订单全部免单
  • 马拉松夺冠机器人将小批量量产:价格与一台入门级小轿车差不多
  • 寻找“香奈儿”代工厂