当前位置: 首页 > news >正文

K-Means聚类算法

文章目录

  • 前言
  • 一、为何要使用先验框
  • 二、K-Means聚类算法核心思想
  • 三、代码实现
  • 总结


前言

本文用于学习记录yolov2当中所使用到的K-Means聚类算法提取先验框。


提示:以下是本篇文章正文内容,下面案例可供参考

一、为何要使用先验框

先验框是在训练神经网络之前定义的框,用于知道yolo网络学习如何预测目标的位置和类别。yolov2中的先验框是基于训练数据集中的目标边界框而来,代表了不同目标的不同尺寸和比例。采用先验框可以使得模型快速收敛,加快训练所需时间。

二、K-Means聚类算法核心思想

  • 初始化聚类中心,可以随机选取边界框作为初始化先验框。
  • 计算每个数据中的边界框到每个聚类先验框的距离1-IOU(box1,box2)。
  • 将每个边界框分配到距离最近的聚类中心。
  • 更新聚类中心(使用分配给它的所有边界框的平均值或者中位数等)。
  • 重复以上步骤,直到聚类中心不在发生显著变化或者达到预定的迭代次数。

三、代码实现

import numpy as npdef iou(box, clusters):"""计算单个边界框与所有聚类中心的 IoU。:param box: 单个边界框的宽高 [w, h]:param clusters: K 个聚类中心的宽高数组,形状 (K, 2):return: IoU 值数组,形状 (K,)"""x = np.minimum(clusters[:, 0], box[0])y = np.minimum(clusters[:, 1], box[1])intersection = x * ybox_area = box[0] * box[1]cluster_area = clusters[:, 0] * clusters[:, 1]return intersection / (box_area + cluster_area - intersection)def kmeans(boxes, k, max_iter=100):rows = boxes.shape[0]distances = np.empty((rows, k))last_clusters = np.zeros((rows,))# 随机初始化聚类中心clusters = boxes[np.random.choice(rows, k, replace=False)]while True:# 计算距离矩阵for row in range(rows):distances[row] = 1 - iou(boxes[row], clusters)# 分配样本到最近簇nearest_clusters = np.argmin(distances, axis=1)# 终止条件:簇分配不再变化if (last_clusters == nearest_clusters).all():breaklast_clusters = nearest_clusters# 更新簇中心(取中位数)for cluster in range(k):clusters[cluster] = np.median(boxes[nearest_clusters == cluster], axis=0)return clustersdef convert_anchors(clusters, input_size=416, downsample=32):"""将聚类结果转换为绝对尺寸。:param clusters: 聚类中心数组,形状 (K, 2):param input_size: 输入图像尺寸(如 416):param downsample: 下采样倍率(如 32)"""return clusters * (input_size / downsample)def avg_iou(boxes, clusters):return np.mean([np.max(iou(boxes[i], clusters)) for i in range(boxes.shape[0])])boxes = np.array([[100,80],[120,110],[150,130],[200,180],[300,250],[100,60],[60,80],[80,90],[90,100],[100,500]]
)clusters = kmeans(boxes, 2)
print(avg_iou(boxes, clusters))

总结

本文记录的yolov2当中使用的K-Means聚类算法思想及其代码实现,便于以后使用该算法用于回顾。

相关文章:

  • 【IC验证】systemverilog_并行线程(块)
  • 《Android 应用开发基础教程》——第四章:Intent 与 Activity 跳转、页面传值
  • 退役淘汰的硬盘数据安全处置不可忽视-硬盘数据抹除清零
  • 【机器学习-线性回归-1】深入理解线性回归:机器学习中的经典算法
  • SQL_连续登陆问题
  • 【前端Skill】点击目标元素定位跳转IDE中的源代码
  • LLM大模型中的基础数学工具—— 约束优化
  • 一个很简单的机器学习任务
  • 技术视界 | 开源新视野: 人形机器人技术崛起,开源社区驱动创新
  • 消息队列知识点详解
  • 基于RK3588+FPGA+AI YOLO的无人船目标检测系统(一)概述
  • 每天五分钟机器学习:凸优化
  • SBTI科学碳目标认证有什么要求?SBTI认证的好处?
  • MES系统中标签模板设计框架与实现思路
  • C++常用函数合集
  • 考研单词笔记 2025.04.21
  • qt画一朵花
  • elasticsearch7.15节点磁盘空间满了迁移数据到新磁盘
  • 【系统架构设计师】信息安全的概念
  • 每天学一个 Linux 命令(30):cut
  • 对话地铁读书人|豪宅房产经纪人:读书使我免于抑郁
  • 女子伸腿阻止高铁关门被拘,央媒:严格依规公开处理以儆效尤
  • 非法收受财物2.29亿余元,窦万贵受贿案一审开庭
  • 全年拟定脑机接口等9个主题,“张江论剑”科创沙龙启动
  • 碳市场扩围推动汽车行业降碳,用真实碳数据量化成本是关键
  • 吉林省委组织部副部长王琦已任长春市领导