当前位置：首页 > news >正文

图像预处理-霍夫变换

news 来源：原创 2025/4/25 17:09:36

一.概念

霍夫变换是图像处理的一种技术，主要用于检测图像中的直线、圆等几何形状。基本思想就是将图像空间（直角坐标系或极坐标系）中的点映射到(霍夫空间)参数空间中，通过在参数空间中寻找累计最大值实现对特定形状的检测。

接下来以下面这张图进行说明：

二.霍夫直线变换

这种简单的又称为标准霍夫变换

2.1 直角坐标系

对于一条直线（不垂直于x轴的直线），都可以用 y=k x+b 来表示，此时，x和y是横纵坐标，k和b是一个固定参数。而霍夫变换将斜率k作为自变量，截距b作为因变量，式子也就变成了

b = -xk+y

也就是说，霍夫空间中一点相当直角坐标系中的一条直线，霍夫空间中一条边相当于直角坐标系一个点。反之，霍夫空间的点和直线也可以映射到直角坐标系中。

同时我们是想要找到直角坐标系上的一条直线，因此我们引进了投票机制，让我们画的直线上包含更多的边缘点。而换到霍夫空间中，就是找到一个点，这个点被很多条直线经过。

2.2 极坐标系

然而直角坐标系中对于x=1这种直线（垂直于x轴）来说，y已经不存在了，斜率无穷大，无法映射到霍夫空间中去。因此我们需要采用另一种坐标系：

极坐标系

注意：极坐标系中的theta是不是该直线与x轴的角度，而是从原点作一条直线垂直于目标直线，垂直的直线与x轴的角度才对

极坐标系下是一样的，极坐标中的点对应霍夫空间中的线，霍夫空间中的点对应极坐标中的直线。并且此时的霍夫空间不再是以k为横轴、b为纵轴，而是以为θ横轴、ρ(上图中的r)为纵轴。

2.3 API使用

lines=cv2.HoughLines(image, rho, theta, threshold)

- image：输入图像，通常为二值图像，其中白点表示边缘点，黑点为背景。

- rho：r的精度，以像素为单位，表示霍夫空间中每一步的距离增量, 值越大，考虑越多的线。

- theta：角度θ的精度，通常以弧度为单位，表示霍夫空间中每一步的角度增量。值越小，考虑越多的线。

- threshold：累加数阈值，只有累积投票数（点数）超过这个阈值的候选直线才会被返回。

- 返回值：一个二维数组，每一行代表一条直线在霍夫空间中的参数 (rho, theta)也就是（r，θ）。

# 养成好习惯，每次都自己敲前面的步骤
import cv2 as cv
import numpy as npimg = cv.imread('../images/huofu.png')# 灰度化
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)# 边缘检测
edges = cv.Canny(gray, 30, 70)# 获取边缘中的直线
lines = cv.HoughLines(edges,0.8, np.pi/180, 90)# np.pie/180表示把度数转化为弧度
print(lines)

[[[25.6 1.5707964]]

[[21.6 1.5707964]]

[[42.4 2.146755 ]]

[[46.4 2.146755 ]]]

可见lines是三维数组，遍历时只能拿出一个数据，需要用line[0]来取出二维数组中的每一个值。

# 绘制直线
for line in lines:rho, theta = line[0]# 获取sin_theta和cos_thetasin_theta = np.sin(theta)cos_theta = np.cos(theta)# 计算直线的起点和终点，假设直线交于图像左右两侧x0,x1 = 0,img.shape[1]# 根据公式推算得出y的值y0 = int((rho-x0*cos_theta)/sin_theta)y1 = int((rho-x1*cos_theta)/sin_theta)# 绘制直线cv.line(img,(x0,y0),(x1,y1),(0,0,255),1)

上面说的公式就是这个推导而来：

也可以有另一个假设，y1,y2 = 0,img.shape[0]，画出来的图都是一样的，opencv绘制直线是根据给出的坐标计算修改该线上其他点，超出的部分不绘制即可。就算起始坐标与终点坐标不在原图上也可以。

最后的阈值要合适，取的小容易得到很多错误的线，甚至可能检测到水平或垂直的线导致绘图时将坐标转为int类型时无法进行，因为角度趋近于0导致sin_theta过小，进而使得int前坐标过大，报 cannot convert float infinity to integer。

# 显示图像
cv.imshow('image', img)
cv.waitKey(0)
cv.destroyAllWindows()

三.统计概率霍夫直线变换

是一种改进的霍夫变换，它在获取到直线之后，会检测原图中在该直线上的点，并获取到两侧的端点坐标，也就是不需要我们自己计算坐标了。然后通过两个点的坐标来计算该直线的长度，通过直线长度与最短长度阈值的比较来决定该直线要不要被保留。

lines=cv2.HoughLinesP(image, rho, theta, threshold, lines=None, minLineLength=0, maxLineGap=0)

- image：输入图像，通常为二值图像，其中白点表示边缘点，黑点为背景。
- rho：极径分辨率，以像素为单位，表示极坐标系中的距离分辨率。
- theta：极角分辨率，以弧度为单位，表示极坐标系中角度的分辨率。
- threshold：阈值，用于过滤掉弱检测结果，只有累计投票数超过这个阈值的直线才会被返回。
- lines（可选）：一个可初始化的输出数组，用于存储检测到的直线参数。
- minLineLength（可选）：最短长度阈值，比这个长度短的线会被排除。
- maxLineGap（可选）：同一直线两点之间的最大距离。当霍夫变换检测到一系列接近直角的线段时，这些线段可能是同一直线的不同部分。该参数指定了在考虑这些线段属于同一直线时，它们之间最大可接受的像素间隔。

返回值：一个二维数组，每个元素是一个包含4个元素的数组，分别表示每条直线的起始点和结束点在图像中的坐标（x1, y1, x2, y2）。

import cv2 as cv
import numpy as npimg = cv.imread('../images/huofu.png')# 灰度化
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)# 边缘检测
edges = cv.Canny(gray, 30, 70)# 获取边缘中的直线
lines = cv.HoughLinesP(edges, 0.8, np.pi/180, 90, minLineLength=50, maxLineGap=50)
print(lines)

[[[ 12 22 172 22]]

[[ 21 64 157 152]]

[[ 11 26 174 26]]

[[ 19 68 152 154]]

[[ 19 67 155 155]]]

# 绘制直线
for line in lines:x0,y0,x1,y1 = line[0]# 绘制直线cv.line(img,(x0,y0),(x1,y1),(0,0,255),1)

# 显示图像
cv.imshow('image', img)
cv.waitKey(0)
cv.destroyAllWindows()

四.霍夫圆变换

它可以从图像中找出潜在的圆形结构，并返回它们的中心坐标和半径。只不过线是用(r,θ)表示，圆是用(x_center,y_center,r)来表示，从二维变成了三维，数据量变大了很多。所以一般使用霍夫梯度法减少计算量。

circles=cv2.HoughCircles(image, method, dp, minDist, param1, param2)

- method：霍夫变换方法:霍夫梯度法，可以是 cv2.HOUGH_GRADIENT，这是唯一在OpenCV中用于圆检测的方法。

- dp：累加器分辨率与输入图像分辨率之间的降采样比率，用于加速运算但不影响准确性。设置为1表示霍夫梯度法中累加器图像的分辨率与原图一致

- minDist：检测到的圆心之间的最小允许距离，以像素为单位。

- param1 和 param2：这两个参数是在使用 cv2.HOUGH_GRADIENT 方法时的特定参数，分别为：

- param1(可选)：阈值1，决定边缘强度的阈值。

- param2：阈值2，控制圆心识别的精确度。较大的该值会使得检测更严格的圆。

- 返回值：一个二维numpy数组，包含了所有满足条件的圆的参数(x_center,y_center,r)。

# 养成好习惯，每次都自己敲前面的步骤
import cv2 as cv
import numpy as npimg = cv.imread('../images/huofu.png')# 灰度化
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)# 边缘检测
edges = cv.Canny(gray, 30, 70)# 获取边缘中的圆
circles = cv.HoughCircles(edges, cv.HOUGH_GRADIENT, 1, 20, param2=30)
print(circles)

[[[177.5 89.5 32.1]]]

# 绘圆
for circle in circles:x, y, r = np.int_(circle[0])cv.circle(img, (x, y), r, (0, 0, 255), 2)

这里使用的是np.int_向下取整对数组进行操作

# 显示图像
cv.imshow('image', img)
cv.waitKey(0)
cv.destroyAllWindows()

优先级队列和仿函数的讲解（底层实现）

QT构建即时通讯应用--WebSocket全面解析与实战指南

Nginx 路径反向代理实战：多服务分发配置与排错指南（CentOS 环境）

C语言编程--15.四数之和

怎样记忆Precision、Recall？

多头注意力

海思ISP调试记录

使用vue2开发一个在线旅游预订平台-前端静态网站项目练习

第16章：MCP服务端项目开发实战：对话系统

优考试V4.20机构版【可注册】

类模板 (Class Templates)

负环-P3385-P2136

【Microsoft Store 中的软件推荐】

4月24号

乡村治理数字化平台：信息技术赋能乡村振兴的深度探索

西甲001：奥萨苏纳VS塞维利亚

手机访问电脑端Nginx服务器配置方式

【力扣刷题|第五天作业】二分查找-寻找旋转排序数组中的最小值 II

frome time import * 与 import time

多物理场仿真底层算法到AI智能仿真革命

中青报：“猿辅导员工猝死”事件上热搜，是对健康职场环境的共同关切

蚂蚁财富28亿港元要约收购耀才证券，筹谋香港券商牌照

珠海市香洲区原区长刘齐英落马，此前已被终止省人大代表资格

破解160年基因谜题，我国科学家补上豌豆遗传研究最后拼图

国际观察｜伦敦会谈“降级”凸显美国乌克兰政策窘境

宁夏中卫深化公立医院机构编制改革：市人民医院机构规格升为正处级