【OpenCV】第二章——图像处理基础
图像处理基础学习笔记
本章节详细介绍了图像处理的基础内容,包括图像的读取、显示、保存,基本属性的查看,图像的变换与操作,以及常用的图像处理方法。
目录
- 图像的读取与显示
- 图像基本属性
- 图像的灰度化与二值化
- 图像的色彩空间转换
- 图像变换与操作
- 图像滤波与平滑
- 边缘检测(Sobel、Canny)
1. 图像的读取与显示
图像是由一系列像素组成的矩阵,在OpenCV中可以使用cv2.imread()
函数读取图像,使用cv2.imshow()
显示图像,使用cv2.imwrite()
保存图像。
示例代码:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 显示图像
cv2.imshow('Image', image)# 等待按键
cv2.waitKey(0)# 保存图像
cv2.imwrite('saved_image.jpg', image)# 关闭所有窗口
cv2.destroyAllWindows()
-
cv2.imread(filename, flag):读取图像,
filename
为文件路径,flag
可以是:cv2.IMREAD_COLOR
:默认,加载为彩色图像cv2.IMREAD_GRAYSCALE
:加载为灰度图像cv2.IMREAD_UNCHANGED
:加载图像,包括透明通道(如果有)
-
cv2.imshow(window_name, image):显示图像。
-
cv2.waitKey(0):等待按键输入。
0
表示无限等待。 -
cv2.imwrite(filename, image):保存图像。
2. 图像基本属性
图像通常是由多个像素组成的数组,我们可以查看图像的维度、通道数、数据类型等基本信息。
示例代码:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 获取图像的属性
height, width, channels = image.shape
print(f"Height: {height}, Width: {width}, Channels: {channels}")# 获取图像数据类型
print(f"Data type: {image.dtype}")
- image.shape:返回图像的高、宽、通道数。对于彩色图像,
shape
返回一个(height, width, channels)
的元组。 - image.dtype:返回图像的类型,如
uint8
,表示每个像素值为0-255之间的整数。
3. 图像的灰度化与二值化
- 灰度化:将彩色图像转换为灰度图像。
- 二值化:根据一个阈值,将图像转换为黑白图像。
示例代码:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 转换为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 显示灰度图像
cv2.imshow('Gray Image', gray_image)# 二值化图像
_, binary_image = cv2.threshold(gray_image, 127, 255, cv2.THRESH_BINARY)# 显示二值化图像
cv2.imshow('Binary Image', binary_image)# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()
-
cv2.cvtColor(image, code):转换颜色空间,
code
可以是:cv2.COLOR_BGR2GRAY
:将BGR图像转换为灰度图像cv2.COLOR_BGR2RGB
:将BGR图像转换为RGB图像cv2.COLOR_BGR2HSV
:将BGR图像转换为HSV图像
-
cv2.threshold():二值化图像。
127
为阈值,255
为大于阈值的像素值,cv2.THRESH_BINARY
为二值化方法。
4. 图像的色彩空间转换
图像有多种色彩空间,其中常用的有RGB、灰度、HSV、YUV等。OpenCV提供了色彩空间转换的功能。
示例代码(RGB与灰度图转换、HSV色彩空间):
import cv2# 读取图像
image = cv2.imread('image.jpg')# RGB与灰度图的转换
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 显示灰度图
cv2.imshow('Gray Image', gray_image)# 转换为HSV色彩空间
hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)# 显示HSV图像
cv2.imshow('HSV Image', hsv_image)# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()
- BGR到HSV:
cv2.COLOR_BGR2HSV
- BGR到YUV:
cv2.COLOR_BGR2YUV
- BGR到LAB:
cv2.COLOR_BGR2LAB
5. 图像变换与操作
图像的变换操作包括缩放、旋转、平移、仿射变换和透视变换。
缩放图像:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 缩放图像
resized_image = cv2.resize(image, (300, 300)) # 目标尺寸为300x300# 显示缩放后的图像
cv2.imshow('Resized Image', resized_image)cv2.waitKey(0)
cv2.destroyAllWindows()
- cv2.resize(image, dsize):调整图像大小,
dsize
为目标尺寸。
旋转与平移图像:
import cv2
import numpy as np# 读取图像
image = cv2.imread('image.jpg')# 获取图像的中心点
center = (image.shape[1] // 2, image.shape[0] // 2)# 旋转矩阵
rotation_matrix = cv2.getRotationMatrix2D(center, 45, 1) # 旋转45度,缩放因子为1# 旋转图像
rotated_image = cv2.warpAffine(image, rotation_matrix, (image.shape[1], image.shape[0]))# 显示旋转后的图像
cv2.imshow('Rotated Image', rotated_image)# 平移图像
translation_matrix = np.float32([[1, 0, 50], [0, 1, 100]]) # 向右平移50个像素,向下平移100个像素
translated_image = cv2.warpAffine(image, translation_matrix, (image.shape[1], image.shape[0]))# 显示平移后的图像
cv2.imshow('Translated Image', translated_image)cv2.waitKey(0)
cv2.destroyAllWindows()
- cv2.getRotationMatrix2D(center, angle, scale):计算旋转矩阵。
- cv2.warpAffine(image, M, dsize):进行仿射变换。
仿射变换与透视变换:
import cv2
import numpy as np# 读取图像
image = cv2.imread('image.jpg')# 仿射变换:通过3个点的对应关系进行图像变换
pts1 = np.float32([[50, 50], [200, 50], [50, 200]]) # 原图中的3个点
pts2 = np.float32([[10, 100], [250, 50], [100, 250]]) # 目标图像中的3个点# 获取仿射变换矩阵
affine_matrix = cv2.getAffineTransform(pts1, pts2)# 应用仿射变换
affine_image = cv2.warpAffine(image, affine_matrix, (image.shape[1], image.shape[0]))# 显示变换后的图像
cv2.imshow('Affine Transformed Image', affine_image)cv2.waitKey(0)
cv2.destroyAllWindows()
- cv2.getAffineTransform(src, dst):获取仿射变换矩阵。
- cv2.warpAffine(image, M, dsize):进行仿射变换。
6. 图像滤波与平滑
图像滤波通常用于去除噪声和平滑图像。常见的滤波方法有平均滤波、高斯滤波、中值滤波和双边滤波。
平均滤波:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 应用平均滤波
blurred_image = cv2.blur(image, (5, 5))# 显示滤波后的图像
cv2.imshow('Blurred Image', blurred_image)cv2.waitKey(0)
cv2.destroyAllWindows()
高斯滤波:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 应用高斯滤波
gaussian_blurred_image = cv2.GaussianBlur(image, (5, 5), 0)# 显示高斯滤波后的图像
cv2.imshow('Gaussian Blurred Image', gaussian_blurred_image)cv2.waitKey(0)
cv2.destroyAllWindows()
中值滤波:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 应用中值滤波
median_blurred_image = cv2.medianBlur(image, 5)# 显示中值滤波后的图像
cv2.imshow('Median Blurred Image', median_blurred_image)cv2.waitKey(0)
cv2.destroyAllWindows()
双边滤波:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 应用双边滤波
bilateral_blurred_image = cv2.bilateralFilter(image, 9, 75, 75)# 显示双边滤波后的图像
cv2.imshow('Bilateral Blurred Image', bilateral_blurred_image)cv2.waitKey(0)
cv2.destroyAllWindows()
7. 边缘检测(Sobel、Canny)
边缘检测用于检测图像中的边缘,常见的边缘检测方法有Sobel算子和Canny算法。
Sobel边缘检测:
import cv2
import numpy as np# 读取图像
image = cv2.imread('image.jpg')# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# Sobel算子进行边缘检测
sobel_x = cv2.Sobel(gray_image, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(gray_image, cv2.CV_64F, 0, 1, ksize=3)# 计算边缘强度
sobel_edges = cv2.magnitude(sobel_x, sobel_y)# 显示边缘图像
cv2.imshow('Sobel Edge Detection', sobel_edges)cv2.waitKey(0)
cv2.destroyAllWindows()
Canny边缘检测:
import cv2# 读取图像
image = cv2.imread('image.jpg')# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# Canny边缘检测
edges = cv2.Canny(gray_image, 100, 200)# 显示边缘图像
cv2.imshow('Canny Edge Detection', edges)cv2.waitKey(0)
cv2.destroyAllWindows()
总结:
以上是图像处理的基础内容,涵盖了图像的读取、显示、基本属性、灰度化、二值化、色彩空间转换、图像变换与操作、图像滤波和平滑以及边缘检测等常用操作。