当前位置：首页 > news >正文

【OpenCV】第二章——图像处理基础

news 来源：原创 2025/4/27 5:44:44

图像处理基础学习笔记

本章节详细介绍了图像处理的基础内容，包括图像的读取、显示、保存，基本属性的查看，图像的变换与操作，以及常用的图像处理方法。

cv2.imread(filename, flag)：读取图像，filename为文件路径，flag可以是：
- cv2.IMREAD_COLOR：默认，加载为彩色图像
- cv2.IMREAD_GRAYSCALE：加载为灰度图像
- cv2.IMREAD_UNCHANGED：加载图像，包括透明通道（如果有）
cv2.imshow(window_name, image)：显示图像。
cv2.waitKey(0)：等待按键输入。0表示无限等待。
cv2.imwrite(filename, image)：保存图像。

2. 图像基本属性

图像通常是由多个像素组成的数组，我们可以查看图像的维度、通道数、数据类型等基本信息。

示例代码：

import cv2# 读取图像
image = cv2.imread('image.jpg')# 获取图像的属性
height, width, channels = image.shape
print(f"Height: {height}, Width: {width}, Channels: {channels}")# 获取图像数据类型
print(f"Data type: {image.dtype}")

image.shape：返回图像的高、宽、通道数。对于彩色图像，shape返回一个 (height, width, channels) 的元组。
image.dtype：返回图像的类型，如 uint8，表示每个像素值为0-255之间的整数。

3. 图像的灰度化与二值化

灰度化：将彩色图像转换为灰度图像。
二值化：根据一个阈值，将图像转换为黑白图像。

示例代码：

import cv2# 读取图像
image = cv2.imread('image.jpg')# 转换为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 显示灰度图像
cv2.imshow('Gray Image', gray_image)# 二值化图像
_, binary_image = cv2.threshold(gray_image, 127, 255, cv2.THRESH_BINARY)# 显示二值化图像
cv2.imshow('Binary Image', binary_image)# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.cvtColor(image, code)：转换颜色空间，code可以是：
- cv2.COLOR_BGR2GRAY：将BGR图像转换为灰度图像
- cv2.COLOR_BGR2RGB：将BGR图像转换为RGB图像
- cv2.COLOR_BGR2HSV：将BGR图像转换为HSV图像
cv2.threshold()：二值化图像。127为阈值，255为大于阈值的像素值，cv2.THRESH_BINARY为二值化方法。

4. 图像的色彩空间转换

图像有多种色彩空间，其中常用的有RGB、灰度、HSV、YUV等。OpenCV提供了色彩空间转换的功能。

示例代码（RGB与灰度图转换、HSV色彩空间）：

import cv2# 读取图像
image = cv2.imread('image.jpg')# RGB与灰度图的转换
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 显示灰度图
cv2.imshow('Gray Image', gray_image)# 转换为HSV色彩空间
hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)# 显示HSV图像
cv2.imshow('HSV Image', hsv_image)# 等待按键
cv2.waitKey(0)
cv2.destroyAllWindows()

BGR到HSV：cv2.COLOR_BGR2HSV
BGR到YUV：cv2.COLOR_BGR2YUV
BGR到LAB：cv2.COLOR_BGR2LAB

5. 图像变换与操作

图像的变换操作包括缩放、旋转、平移、仿射变换和透视变换。

缩放图像：

import cv2# 读取图像
image = cv2.imread('image.jpg')# 缩放图像
resized_image = cv2.resize(image, (300, 300))  # 目标尺寸为300x300# 显示缩放后的图像
cv2.imshow('Resized Image', resized_image)cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.resize(image, dsize)：调整图像大小，dsize为目标尺寸。

旋转与平移图像：

import cv2
import numpy as np# 读取图像
image = cv2.imread('image.jpg')# 获取图像的中心点
center = (image.shape[1] // 2, image.shape[0] // 2)# 旋转矩阵
rotation_matrix = cv2.getRotationMatrix2D(center, 45, 1)  # 旋转45度，缩放因子为1# 旋转图像
rotated_image = cv2.warpAffine(image, rotation_matrix, (image.shape[1], image.shape[0]))# 显示旋转后的图像
cv2.imshow('Rotated Image', rotated_image)# 平移图像
translation_matrix = np.float32([[1, 0, 50], [0, 1, 100]])  # 向右平移50个像素，向下平移100个像素
translated_image = cv2.warpAffine(image, translation_matrix, (image.shape[1], image.shape[0]))# 显示平移后的图像
cv2.imshow('Translated Image', translated_image)cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.getRotationMatrix2D(center, angle, scale)：计算旋转矩阵。
cv2.warpAffine(image, M, dsize)：进行仿射变换。

仿射变换与透视变换：

import cv2
import numpy as np# 读取图像
image = cv2.imread('image.jpg')# 仿射变换：通过3个点的对应关系进行图像变换
pts1 = np.float32([[50, 50], [200, 50], [50, 200]])  # 原图中的3个点
pts2 = np.float32([[10, 100], [250, 50], [100, 250]])  # 目标图像中的3个点# 获取仿射变换矩阵
affine_matrix = cv2.getAffineTransform(pts1, pts2)# 应用仿射变换
affine_image = cv2.warpAffine(image, affine_matrix, (image.shape[1], image.shape[0]))# 显示变换后的图像
cv2.imshow('Affine Transformed Image', affine_image)cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.getAffineTransform(src, dst)：获取仿射变换矩阵。
cv2.warpAffine(image, M, dsize)：进行仿射变换。

6. 图像滤波与平滑

图像滤波通常用于去除噪声和平滑图像。常见的滤波方法有平均滤波、高斯滤波、中值滤波和双边滤波。

平均滤波：

import cv2# 读取图像
image = cv2.imread('image.jpg')# 应用平均滤波
blurred_image = cv2.blur(image, (5, 5))# 显示滤波后的图像
cv2.imshow('Blurred Image', blurred_image)cv2.waitKey(0)
cv2.destroyAllWindows()

高斯滤波：

import cv2# 读取图像
image = cv2.imread('image.jpg')# 应用高斯滤波
gaussian_blurred_image = cv2.GaussianBlur(image, (5, 5), 0)# 显示高斯滤波后的图像
cv2.imshow('Gaussian Blurred Image', gaussian_blurred_image)cv2.waitKey(0)
cv2.destroyAllWindows()

中值滤波：

import cv2# 读取图像
image = cv2.imread('image.jpg')# 应用中值滤波
median_blurred_image = cv2.medianBlur(image, 5)# 显示中值滤波后的图像
cv2.imshow('Median Blurred Image', median_blurred_image)cv2.waitKey(0)
cv2.destroyAllWindows()

双边滤波：

import cv2# 读取图像
image = cv2.imread('image.jpg')# 应用双边滤波
bilateral_blurred_image = cv2.bilateralFilter(image, 9, 75, 75)# 显示双边滤波后的图像
cv2.imshow('Bilateral Blurred Image', bilateral_blurred_image)cv2.waitKey(0)
cv2.destroyAllWindows()

7. 边缘检测（Sobel、Canny）

边缘检测用于检测图像中的边缘，常见的边缘检测方法有Sobel算子和Canny算法。

Sobel边缘检测：

import cv2
import numpy as np# 读取图像
image = cv2.imread('image.jpg')# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# Sobel算子进行边缘检测
sobel_x = cv2.Sobel(gray_image, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(gray_image, cv2.CV_64F, 0, 1, ksize=3)# 计算边缘强度
sobel_edges = cv2.magnitude(sobel_x, sobel_y)# 显示边缘图像
cv2.imshow('Sobel Edge Detection', sobel_edges)cv2.waitKey(0)
cv2.destroyAllWindows()

Canny边缘检测：

import cv2# 读取图像
image = cv2.imread('image.jpg')# 转为灰度图
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# Canny边缘检测
edges = cv2.Canny(gray_image, 100, 200)# 显示边缘图像
cv2.imshow('Canny Edge Detection', edges)cv2.waitKey(0)
cv2.destroyAllWindows()