两个面向视觉定位的遥感船舶数据集:RSSVGSARVG
- 项目地址:LwZhan-WUT/VGRSS:VGRSS:用于遥感船舶图像视觉接地的代码和数据集(RSSVG和SARVG)。
- 数据集:https://drive.google.com/drive/folders/1wAGJAn5yIUIvBuK5rUNfo-CKDiKq1A57?usp=sharing
遥感船舶图像视觉定位(VGRSS)任务
VGRSS的目标是通过自然语言指导在遥感图像中定位船舶目标。针对该任务,WUTCM实验室建立了两个数据集:RSSVG和SARVG。
RSSVG Dataset
RSSVG数据集基于光学遥感影像,包含25,237对光学遥感图像-文本查询及11,157张图像,平均描述长度9.77词(最长17词)。语言表达呈现多维度特征,高频词汇"货轮"凸显船舶类型标注,同时涵盖尺寸(大/中/小)、颜色(白/蓝)、方位(左/右)及工程属性(甲板/引擎),完整刻画船舶外观与场景语义,适用于复杂光学影像的细粒度视觉定位。
SARVG Dataset
SARVG数据集基于合成孔径雷达(SAR)影像,包含54,429对SAR图像-文本查询及43,798张图像,平均描述长度7.72词(最长19词)。语言特征聚焦空间关系与尺寸对比,高频词"大型船舶"“中尺寸"配合方位词"左上”"右下"形成核心描述范式,契合SAR图像低纹理、高几何特性的解析需求,强化了船舶位置感知与相对尺度判读能力。
相关模型:
VGRSS: Datasets and Models for Visual Grounding in Remote Sensing Ship Images | IEEE Journals & Magazine | IEEE Xplore
Y. Chen, L. Zhan, Y. Zhao, S. Xiong and X. Lu, "VGRSS: Datasets and Models for Visual Grounding in Remote Sensing Ship Images," in IEEE Transactions on Geoscience and Remote Sensing, doi: 10.1109/TGRS.2025.3562717.
致谢:
RSSVG 数据集源自 FAIR1M、CGWX 和 DIOR-RSVG 数据集的船舶部分,而 SARVG 数据集源自 SAR-Ship-Dataset。我们感谢这些数据集的作者提供他们的数据,这极大地促进了我们的研究。我们的部分代码基于 TransVG,我们感谢各个作者的宝贵贡献。我们还感谢武汉理工大学计算机与人工智能学院对这项研究的支持。