当前位置: 首页 > news >正文

coco128数据集格式

 一、数据集内容

每一行表示一个目标的信息:5个字段(class_id, x_center, y_center, width, height

 二、可视化标注框与类别

import os
import cv2
import matplotlib.pyplot as plt# 设置路径
data_dir = "F:/datasets/coco128"  # 替换为你的实际路径
image_folder = os.path.join(data_dir, "images/train2017")  # 选择train/val/test
label_folder = os.path.join(data_dir, "labels/train2017")  # 对应标签文件夹# 手动指定图像文件名(例如:"0000001.jpg")
target_image_name = "000000000025.jpg"  # 修改为目标图像名
image_path = os.path.join(image_folder, target_image_name)
label_path = os.path.join(label_folder, os.path.splitext(target_image_name)[0] + '.txt')# 检查文件是否存在
if not os.path.exists(image_path):print(f"错误:图像文件 {image_path} 不存在!")exit()
if not os.path.exists(label_path):print(f"错误:标签文件 {label_path} 不存在!")exit()# 读取图像
image = cv2.imread(image_path)
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  # 转换为RGB格式
img_h, img_w = image.shape[:2]  # 获取图像高宽# 读取并绘制YOLO标签
with open(label_path, 'r') as f:for line in f.readlines():parts = line.strip().split()if len(parts) < 5:continue  # 跳过格式错误的行class_id, x_center, y_center, width, height = map(float, parts[:5])# 转换为绝对坐标(像素值)x_center *= img_wy_center *= img_hwidth *= img_wheight *= img_hx_min = int(x_center - width / 2)y_min = int(y_center - height / 2)x_max = int(x_center + width / 2)y_max = int(y_center + height / 2)# 绘制边界框(绿色框,线宽2像素)cv2.rectangle(image, (x_min, y_min), (x_max, y_max), (0, 255, 0), 2)# 仅显示类别数值(class_id)cv2.putText(image, f"{int(class_id)}",(x_min, y_min - 10),cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)# 显示结果
plt.figure(figsize=(12, 8))
plt.imshow(image)
plt.axis('off')
plt.title(f"Image: {target_image_name} (Class IDs only)")
plt.show()

相关文章:

  • 信息系统项目管理工程师备考计算类真题讲解三
  • What are the advantages of our neural network inference framework?
  • 【Sequelize】关联模型和孤儿记录
  • C#中async await异步关键字用法和异步的底层原理
  • YOLOv2 性能评估与对比分析详解
  • 操作系统内核调度:抢占式与非抢占式及RTOS中的应用
  • 目标检测与分割:深度学习在视觉中的应用
  • 代码随想录算法训练营Day30
  • NO.93十六届蓝桥杯备战|图论基础-拓扑排序|有向无环图|AOV网|摄像头|最大食物链计数|杂物(C++)
  • linux ceres库编译注意事项及测试demo
  • Java学习手册:Java线程安全与同步机制
  • V型调节阀:专为解决锂电池行业碳酸锂结晶介质的革命性方案-耀圣
  • 《Training Language Models to Self-Correct via Reinforcement Learning》全文翻译
  • go入门记录
  • 金能电力领跑京东工业安全工器具赛道 2025年首季度数据诠释“头部效应”
  • 基于工业操作系统构建企业数字化生态的实践指南
  • 编码风格(二)——使用具有风格的语言特性、格式和风格的挑战
  • leetcode0547. 省份数量-medium
  • 报告分享 | 模型上下文协议(MCP):实现大模型与外部工具的标准化交互
  • L1-6 大勾股定理(PTA)
  • 广西气象干旱面积97.5%,影响人畜饮水、农业生产
  • 泽连斯基:俄军违反停火承诺,20日10时起前线俄炮击增加
  • 一周观展|上海,一系列特展大展渐次呈现
  • 重点并不在于设计更聪明的机器,而在于开发宇宙技术的多样性
  • 科技如何赋能社会治理?帮外卖员找新家、无人机处理交通事故……
  • 又有多名券商员工考公转型,近两年证券从业人员数量减逾7%