当前位置: 首页 > news >正文

两个面向视觉定位的遥感船舶数据集:RSSVGSARVG

  • 项目地址:LwZhan-WUT/VGRSS:VGRSS:用于遥感船舶图像视觉接地的代码和数据集(RSSVG和SARVG)。
  • 数据集:https://drive.google.com/drive/folders/1wAGJAn5yIUIvBuK5rUNfo-CKDiKq1A57?usp=sharing

遥感船舶图像视觉定位(VGRSS)任务

​VGRSS的目标是通过自然语言指导在遥感图像中定位船舶目标。针对该任务,WUTCM实验室建立了两个数据集:RSSVG和SARVG。

RSSVG Dataset

RSSVG数据集基于光学遥感影像,包含25,237对光学遥感图像-文本查询及11,157张图像,平均描述长度9.77词(最长17词)。语言表达呈现多维度特征,高频词汇"货轮"凸显船舶类型标注,同时涵盖尺寸(大/中/小)、颜色(白/蓝)、方位(左/右)及工程属性(甲板/引擎),完整刻画船舶外观与场景语义,适用于复杂光学影像的细粒度视觉定位。

SARVG Dataset

SARVG数据集基于合成孔径雷达(SAR)影像,包含54,429对SAR图像-文本查询及43,798张图像,平均描述长度7.72词(最长19词)。语言特征聚焦空间关系与尺寸对比,高频词"大型船舶"“中尺寸"配合方位词"左上”"右下"形成核心描述范式,契合SAR图像低纹理、高几何特性的解析需求,强化了船舶位置感知与相对尺度判读能力。

相关模型:

VGRSS: Datasets and Models for Visual Grounding in Remote Sensing Ship Images | IEEE Journals & Magazine | IEEE Xplore

 

Y. Chen, L. Zhan, Y. Zhao, S. Xiong and X. Lu, "VGRSS: Datasets and Models for Visual Grounding in Remote Sensing Ship Images," in IEEE Transactions on Geoscience and Remote Sensing, doi: 10.1109/TGRS.2025.3562717.

致谢:

RSSVG 数据集源自 FAIR1M、CGWX 和 DIOR-RSVG 数据集的船舶部分,而 SARVG 数据集源自 SAR-Ship-Dataset。我们感谢这些数据集的作者提供他们的数据,这极大地促进了我们的研究。我们的部分代码基于 TransVG,我们感谢各个作者的宝贵贡献。我们还感谢武汉理工大学计算机与人工智能学院对这项研究的支持。

相关文章:

  • 深入解析 Spring Boot Test:架构、核心组件与最佳实践
  • 《多Agent架构VS千万字长文本VS深度推理引擎——拆解Coze、通义、Kimi的AI终局博弈密码》
  • HCIP实验二(OSPF网络配置与优化)
  • Android kotlin通知功能完整实现指南:从基础到高级功能
  • 京东商品详情数据 API 接口讨论学习
  • 《让机器人读懂你的心:情感分析技术融合奥秘》
  • 微服务 RabbitMQ 组件的介绍、安装与使用详解
  • 智能电网第3期 | 配电房巡检机器人通信升级方案
  • 数据库MySQL学习——day2(插入数据与基本查询)
  • Fragment重叠
  • 基于PaddleOCR对图片中的excel进行识别并转换成word(一)
  • 时序约束 记录
  • 【Flutter高效开发】GetX指南:一文学会状态管理、路由与依赖注入
  • 金融租赁质检的三重业务困境 质检LIMS系统的四大价值赋能场景
  • Reactor编程模型介绍
  • vue3:十一、主页面布局(修改顶部导航栏样式-左侧,页面名称设置)
  • 扣子空间 (Coze Space) 使用入门,邀请码获取指南
  • Leetcode98、230:二叉搜索树——递归学习
  • 第十章: User Interface Integration
  • Hive 多表查询案例
  • 嫦娥八号任务合作项目,这十个入选
  • 北京顺义:做好潮白河大桥事故善后处置,举一反三排查风险
  • 刺激视网膜可让人“看”到全新颜色
  • “下一个高增长市场,还是中国”,龚正市长会见参加上海车展的国际企业高管
  • 神二十明日发射,长二F火箭推进剂加注工作已完成
  • 解密帛书两千年文化传承,《帛书传奇》央视今晚开播