当前位置：首页 > news >正文

两个面向视觉定位的遥感船舶数据集：RSSVGSARVG

news 来源：原创 2025/4/24 10:41:03

项目地址：LwZhan-WUT/VGRSS：VGRSS：用于遥感船舶图像视觉接地的代码和数据集（RSSVG和SARVG）。
数据集：https://drive.google.com/drive/folders/1wAGJAn5yIUIvBuK5rUNfo-CKDiKq1A57?usp=sharing

遥感船舶图像视觉定位（VGRSS）任务

VGRSS的目标是通过自然语言指导在遥感图像中定位船舶目标。针对该任务，WUTCM实验室建立了两个数据集：RSSVG和SARVG。

RSSVG Dataset

RSSVG数据集基于光学遥感影像，包含25,237对光学遥感图像-文本查询及11,157张图像，平均描述长度9.77词（最长17词）。语言表达呈现多维度特征，高频词汇"货轮"凸显船舶类型标注，同时涵盖尺寸（大/中/小）、颜色（白/蓝）、方位（左/右）及工程属性（甲板/引擎），完整刻画船舶外观与场景语义，适用于复杂光学影像的细粒度视觉定位。

SARVG Dataset

SARVG数据集基于合成孔径雷达（SAR）影像，包含54,429对SAR图像-文本查询及43,798张图像，平均描述长度7.72词（最长19词）。语言特征聚焦空间关系与尺寸对比，高频词"大型船舶"“中尺寸"配合方位词"左上”"右下"形成核心描述范式，契合SAR图像低纹理、高几何特性的解析需求，强化了船舶位置感知与相对尺度判读能力。

致谢：

RSSVG 数据集源自 FAIR1M、CGWX 和 DIOR-RSVG 数据集的船舶部分，而 SARVG 数据集源自 SAR-Ship-Dataset。我们感谢这些数据集的作者提供他们的数据，这极大地促进了我们的研究。我们的部分代码基于 TransVG，我们感谢各个作者的宝贵贡献。我们还感谢武汉理工大学计算机与人工智能学院对这项研究的支持。