当前位置: 首页 > news >正文

HOW MUCH POSITION INFORMATION DO CONVOLUTIONAL NEURAL NETWORKS ENCODE?

1. 动机:

  卷积神经网络中的卷积操作实际上是一个局部的操作,这样的话就会使得它虽然知道自己看的是什么,但是却不清楚他在图像中的位置信息,但是位置信息实际上是很有用的,因此CNN可能潜在的学习到了如何去编码这种位置信息。所以这篇论文就是为了研究这种位置信息是如何在CNN中编码得到的。

2. 介绍:

  在这篇工作中,他们通过执行一系列的随机试验来检验绝对位置信息的作用,他们假设实际上CNN确实能够编码这种位置信息。本研究揭示了CNN的这种位置信息是从常用到的zero-padding中得到的。

  之前有研究表明即使图像是完全的噪声仍然可以通过训练得到0的损失值,据此,作者也通过这追踪随机性的检测来研究CNN的学习的特征,但是这篇工作不同于之前的方法只关注于可视化和理解,并没有研究位置的关系。


  问题的定式表达:给定一个输入的图像,我们的目标是为了预测一个gradient-like的位置信息遮罩,它里面的每个像素位置的值代表了他在那从左往右或从上往下的位置。我们生成一个遮罩\mathcal{G}_{pos} \in \mathbb{R}^{h \times w},这个遮

相关文章:

  • web原生API AbortController网络请求取消方法使用介绍:防止按钮重复点击提交得最佳方案
  • 总结设计测试用例的万能公式
  • 基于LLM的响应式流式处理实践:提升用户体验的关键技术
  • 算法 | 鲸鱼优化算法(WOA)原理,公式,应用,算法改进研究综述,完整matlab代码
  • 测试用例书写规范详解:构建高效测试体系的基础
  • STM32H5开发陀螺仪LSM6DSV16X(3)----SFLP获取四元数
  • spring boot使用Scheduling实现动态增删启停定时任务
  • 8051单片机所有Keil C51汇编伪指令和C语言关键字大全
  • DAG(有向无环图)计算模型面试内容整理-DAG的特点和应用场景
  • Python第一周作业
  • 大模型学习笔记 day01 提示工程入门1.One-shot Few-shot提示学习法
  • XSS详解
  • Oracle RMAN同步数据库Active database duplicate
  • Elasticsearch中的_source字段讲解
  • YOLOv12综述:基于注意力的增强与先前版本的对比分析
  • Spring MVC 执行流程全解析:从请求到响应的七步走
  • JavaWeb学习打卡-Day1-分层解耦、Spring IOC、DI
  • 实践项目开发-hbmV4V20250407-readme
  • Redis 慢查询分析与优化
  • 2025 年职业院校技能大赛网络建设与运维赛项Docker赛题解析
  • 民政部:从未设立或批准设立“一脉养老”“惠民工程”项目,有关App涉嫌诈骗
  • 商务部:服务业扩大开放试点任务多数来源于经营主体实际需要
  • 美国同日曝两起泄密事件:防长群聊向家人分享作战计划,白宫平面图被“共享”
  • 上海黄金交易所:贵金属价格波动剧烈,提示投资者做好风险防范
  • 谁在贩卖个人信息?教培机构信息失守,电商平台“订单解密”
  • 价格周报|本周生猪均价环比上涨,交易均重继续上升