当前位置: 首页 > news >正文

Simple-BEV论文解析

背景

现有的工作为了避免昂贵的激光雷达,只使用多图像输入来生成BEV特征表示,忽略了radar数据;并且大多数技术都着重如何将图像特征lift到BEV平面,使用更大分辨率的输入与Backbone,这导致在多视角BEV感知下什么是最重要的这个问题缺乏研究。

贡献

  • 只使用了简单的无参lift投影操作获取BEV特征图,重点研究了batch、图像分辨率、数据增强与lift策略等的影响,消融实验做的好,说明batch,图像分辨率用的好能提高指标,而lift操作的差别影响不大。
  • 提出了radar+camera融合,能极好地提升指标质量,这是由于radar能识别远距离物体,并且受恶劣环境影响小
    ,能够与相机进行有效互补,但其数据稀疏,且有噪声。

方法

在这里插入图片描述

配置与总体架构

数据输入是多视角图像、radar甚至lidar,传感器内外参已知并且传感器之间很好地数据同步。模型定义3D感知范围,前后、左右100m,上下10m,平面分辨率设为200×200,高度分辨率设为8,而这个体素空间以前置摄像头为中心,左右方向为X轴,上下方向为Y轴,前后方向为Z轴。
总体架构上,使用ResNet提取每个相机的特征,将其lift到3D再拍扁成BEV,最后对BEV视角再用ResNet得到输出

相关文章:

  • module.noParse(跳过指定文件的依赖解析)
  • [贪心_8] 跳跃游戏 | 单调递增的数字 | 坏了的计算器
  • GitOps进化:深入探讨 Argo CD 及其对持续部署的影响
  • 青少年编程与数学 02-018 C++数据结构与算法 12课题、递归
  • 多模态大语言模型arxiv论文略读(四十二)
  • Dify框架面试内容整理-Dify如何实现模型调用与管理?
  • 【OSG学习笔记】Day 10: 字体与文字渲染(osgText)
  • 两台没有网络的电脑如何通过网线共享传输文件
  • Compose笔记(十八)--rememberLazyListState
  • 【第11节 嵌入式软件的组成】
  • 从后端研发角度出发,使用k8s部署业务系统
  • ARP协议【复习篇】
  • Tortoise-ORM级联查询与预加载性能优化
  • Nacos简介—3.Nacos的配置简介
  • 如何修改npm的全局安装路径?
  • 冲刺一区!挑战7天一篇文献计量学SCI DAY1-7
  • 机器之眼megauging(工业机器视觉软件)是否开源?
  • 【机器学习-线性回归-3】深入浅出:简单线性回归的概念、原理与实现
  • C#中常见的设计模式
  • 金融行业微服务架构设计与挑战 - Java架构师面试实战
  • 读科学发展的壮丽史诗,也读普通人的传奇
  • 视频丨伊朗阿巴斯港一处油罐发生高强度爆炸:造成大面积破坏,伤亡不明
  • 偷拍拷贝某轨道车技术信息后撰写论文发表,工程师被判一年有期徒刑
  • 四川一国企“80后”掌门人为报领导“知遇之恩”,盲目决策致数亿损失
  • 上海嘉定远香文化环启用,运动、看展、听歌“一站式解决”
  • 韩国对华中厚板征收临时反倾销税