当前位置：首页 > news >正文

多骨干、多融合：RT-DETR 如何解锁主干网络新姿势？

news 来源：原创 2025/4/23 11:06:19

这篇来说说“多模态融合”，最近有很多同学来问如何拿到“第0层特征图”，也就是没经过模块处理的那层特征图，也就是我下图框住的这层的输入特征图，那我猜测大家可能想做一个类似于“多模态融合”的一个结构；

在这里插入图片描述

一般常见的可能都是两种模态的输入数据，比如红外图像和RGB图像，或者深度图像和RGB图像，这种都是真正的两个模态的输入数据，

有些同学可能也想做一些“单RGB图像的多模态”，主要就是表现在多个特征提取主干，个人觉得这也算是很好的思路，虽然输入的数据是还是单RGB，但是确实可以模仿“多模态融合”做一些工作的，比如像下面这个论文讲到的一些方法，“单RGB图像的多模态”也同样可以做到
。

下面就说下如何在 RT-DETR 如何实现多主干特征融合方式，主要就是添加一个模块，这个模块是我在v9中看到的，相当于是一个什么也不做的模块，就是为了我们在 yaml<

面试网络基础知识 — IP地址

【Pandas】pandas DataFrame div

SAS宏核心知识与实战应用

MCP（3）：在CherryStudio中使用MCPServer

映射（Mapping）和地址（Address）

创建表结构

UiPath API 调用文档

4.19除自身以外数组的乘积

Linux第十讲：进程间通信IPC