当前位置: 首页 > news >正文

多骨干、多融合:RT-DETR 如何解锁主干网络新姿势?

文章目录

    • 前言
    • 模块添加方法
    • 双特征提取例子
      • `GhostNet+ShuffleNet` 双主干
        • 结构图
        • 代码
      • `Swin+ShuffleNet` 双主干
        • 结构图
        • 代码
    • 参数量与计算量


前言

这篇来说说“多模态融合”,最近有很多同学来问如何拿到“第0层特征图”,也就是没经过模块处理的那层特征图,也就是我下图框住的这层的输入特征图,那我猜测大家可能想做一个类似于“多模态融合”的一个结构;

在这里插入图片描述

一般常见的可能都是两种模态的输入数据,比如红外图像和RGB图像,或者深度图像和RGB图像,这种都是真正的两个模态的输入数据,

有些同学可能也想做一些“单RGB图像的多模态”,主要就是表现在多个特征提取主干,个人觉得这也算是很好的思路,虽然输入的数据是还是单RGB,但是确实可以模仿“多模态融合”做一些工作的,比如像下面这个论文讲到的一些方法,“单RGB图像的多模态”也同样可以做到

下面就说下如何在 RT-DETR 如何实现多主干特征融合方式,主要就是添加一个模块,这个模块是我在v9中看到的,相当于是一个什么也不做的模块,就是为了我们在 yaml<

相关文章:

  • 面试网络基础知识 — IP地址
  • 聚能芯半导体禾润一级代理HT7886开关限流降压变换器 5V – 100V 的宽输入电压3.5A 开关限流降压变换器
  • USB 共享神器 VirtualHere 局域网内远程使用打印机与扫描仪
  • 丰富多样功能的小白工具,视频提取音频,在线使用,无需下载软件
  • QEMU源码全解析 —— 块设备虚拟化(21)
  • 【Pandas】pandas DataFrame div
  • 三网通电玩城平台系统结构与源码工程详解(二):Node.js 服务端核心逻辑实现
  • SAS宏核心知识与实战应用
  • MCP(3):在CherryStudio中使用MCPServer
  • HTTP 请求头与请求体:数据存储的底层逻辑与实践指南
  • 第 2.1 节: 机器人仿真环境选择与配置 (Gazebo, MuJoCo, PyBullet)
  • 映射(Mapping)和地址(Address)
  • 创建表结构
  • UiPath API 调用文档
  • \r在C语言中是什么意思(通俗易懂,附带实例)
  • 算力网络的早期有关论文——自用笔记
  • PageIndex:构建无需切块向量化的 Agentic RAG
  • 4.19除自身以外数组的乘积
  • Linux第十讲:进程间通信IPC
  • “又见112G” | Samtec和Keysight展示新型112 Gbps PAM4连接性
  • 高明士︱纪念坚苦卓绝的王寿南先生
  • 对话地铁读书人|企业公关吴丑丑:阅读中相遇又重逢
  • 骑手眼中的“外卖战”
  • 上海优化餐企发展环境:装修拓展门店最高奖50万,建立问题协调机制
  • “75后”遂宁市长刘会英调任四川省人社厅党组副书记
  • 读懂城市丨“花木之乡”沭阳,一场持续五年的“诚信实验”