当前位置：首页 > news >正文

DreamDiffusion的mae_for_eeg.py网络架构

news 来源：原创 2025/4/21 6:27:28

DreamDiffusion的mae_for_eeg.py网络架构图，包含更细致的模块说明和数据处理流程：

graph TD%% 输入层A[原始EEG信号<br>(批次=2, 通道=128, 长度=512)] --> B[1D块嵌入层]%% 块嵌入处理B -->|"1D卷积<br>(核大小=4, 步长=4)"| C[块序列<br>(2, 128, 1024)]%% 掩码处理C --> D[随机块掩码<br>丢弃75%块<br>可选focus_range局部增强]D --> E[编码器主干<br>24层Transformer]%% 编码器输出E --> F[潜在表示<br>(2, 129, 1024)<br>含CLS标记]%% 双解码路径F --> G[EEG重建解码器]F --> I[图像特征解码器*<br>*可选模块]%% 输出层G --> H[重建EEG信号<br>(2, 128, 512)]I --> J[图像特征图<br>(2, 512, 28×28)]%% 辅助模块F --> K[分类头] & L[映射头]K --> M[分类结果<br>40类]L --> N[低维特征<br>768维]%% 样式定义classDef input fill:#f9f,stroke:#333;classDef conv fill:#9cf,stroke:#333;classDef transformer fill:#c9f,stroke:#333;classDef output fill:#f96,stroke:#333;classDef aux fill:#6f9,stroke:#333;class A input;class B,C conv;class D,E,F,G,I transformer;class H,J output;class K,L,M,N aux;

详细架构说明

输入层
- 接收形状为(2,128,512)的EEG信号
- 2=批次大小，128=通道数，512=时间步长
1D块嵌入层(PatchEmbed1D)
```
nn.Conv1d(in_chans=128, embed_dim=1024, kernel_size=4, stride=4)
```
- 将512长度分割为128个块，每块大小4
- 通过卷积将每个块投影到1024维
掩码处理(关键创新点)
- 随机丢弃75%的块
- 支持focus_range参数强化特定区域的掩码率
- 保留的块与可学习掩码标记拼接
Transformer编码器
- 包含24个标准Transformer块
- 每块含：
```
Block(embed_dim=1024, num_heads=16, mlp_ratio=4)
```
- 输出附加CLS标记的全局特征
双路解码器设计
- EEG重建路径：
  - 8层轻量Transformer
  - 最终全连接层还原原始维度
  - 损失函数：掩码块的MSE损失
- 图像生成路径：
  - 2层Transformer+转置卷积
  - 输出28×28图像特征
  - 损失函数：tanh空间的MSE

辅助任务头

分类头：

nn.Sequential(nn.Conv1d(128→1),nn.Linear(1024→40)
)

映射头：

nn.Sequential(nn.Conv1d(128→1),nn.Linear(1024→768)
)

数据流动示例

关键超参数

模块	参数名	典型值	作用说明
块嵌入	patch_size	4	控制信号分割粒度
编码器	depth	24	特征提取能力
注意力头	num_heads	16	多注意力机制维度
图像解码器	img_recon_weight	1.0	图像重建损失权重
掩码策略	focus_rate	0.5	局部区域掩码增强强度