OpenCV-Python实战——OpenCV常见图像处理技术(❤️万字长文,含大量示例❤️)

Posted 盼小辉丶

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了OpenCV-Python实战——OpenCV常见图像处理技术(❤️万字长文,含大量示例❤️)相关的知识,希望对你有一定的参考价值。

0. 前言

图像处理技术是计算机视觉项目的核心,通常是计算机视觉项目中的关键工具,可以使用它们来完成各种计算机视觉任务。因此,如果要构建计算机视觉项目,就需要对图像处理有足够的了解。在本文中,将介绍计算机视觉项目中常见的图像处理技术,主要包括图像的几何变换和图像滤波等。

1. 拆分与合并通道

再进行图像处理时,有时我们仅需要使用特定通道。因此,必须首先将多通道图像拆分为多个单通道图像,为了拆分通道,可以使用 cv2.split() 函数,cv2.split() 函数将源多通道图像拆分为多个单通道图像。此外,处理完成后,可能希望将多个的单通道图像合并创建为一个多通道图像,为了合并通道,可以使用 cv2.merge() 函数,cv2.merge() 函数将多个单通道图像合并为一个多通道图像。
使用 cv2.split() 函数,从加载的 BGR 图像中获取三个通道:

# 通道拆分
image = cv2.imread('sigonghuiye.jpeg')
(b, g, r) = cv2.split(image)

使用 cv2.merge() 函数,将三个通道合并构建 BGR 图像:

# 通道合并
image_copy = cv2.merge((b, g, r))

需要注意的是,cv2.split() 是一个耗时的操作,所以应该只在绝对必要的时候使用它。作为替代,可以使用 NumPy 切片语法来处理特定通道。例如,如果要获取图像的蓝色通道:

b = image[:, :, 0]

此外,可以消除多通道图像的某些通道(通过将通道值设置为 0 ),得到的图像具有相同数量的通道,但相应通道中的值为 0;例如,如果要消除 BGR 图像的蓝色通道:

image_without_blue = image.copy()
image_without_blue[:, :, 0] = 0

消除其他通道的方法与上述代码原理相同:

# 红蓝通道
image_without_green = image.copy()
image_without_green[:,:,1] = 0
# 蓝绿通道
image_without_red = image.copy()
image_without_red[:,:,2] = 0

然后将得到的图像的通道拆分:

(b_1, g_1, r_1) = cv2.split(image_without_blue)
(b_2, g_2, r_2) = cv2.split(image_without_green)
(b_3, g_3, r_3) = cv2.split(image_without_red)

显示拆分后的通道:

def show_with_matplotlib(color_img, title, pos):
    # Convert BGR image to RGB
    img_RGB = color_img[:,:,::-1]

    ax = plt.subplot(3, 6, pos)
    plt.imshow(img_RGB)
    plt.title(title,fontsize=8)
    plt.axis('off')

image = cv2.imread('sigonghuiye.jpeg')

plt.figure(figsize=(13,5))
plt.suptitle('splitting and merging channels in OpenCV', fontsize=12, fontweight='bold')

show_with_matplotlib(image, "BGR - image", 1)
show_with_matplotlib(cv2.cvtColor(b, cv2.COLOR_GRAY2BGR), "BGR - (B)", 2)
show_with_matplotlib(cv2.cvtColor(g, cv2.COLOR_GRAY2BGR), "BGR - (G)", 2 + 6)
show_with_matplotlib(cv2.cvtColor(r, cv2.COLOR_GRAY2BGR), "BGR - (R)", 2 + 6 * 2)
show_with_matplotlib(image_merge, "BGR - image (merge)", 1 + 6)
show_with_matplotlib(image_without_blue, "BGR without B", 3)
show_with_matplotlib(image_without_green, "BGR without G", 3 + 6)
show_with_matplotlib(image_without_red, "BGR without R", 3 + 6 * 2)
show_with_matplotlib(cv2.cvtColor(b_1, cv2.COLOR_GRAY2BGR), "BGR without B (B)", 4)
show_with_matplotlib(cv2.cvtColor(g_1, cv2.COLOR_GRAY2BGR), "BGR without B (G)", 4 + 6)
show_with_matplotlib(cv2.cvtColor(r_1, cv2.COLOR_GRAY2BGR), "BGR without B (R)", 4 + 6 * 2)
# 显示其他拆分通道的方法完全相同,只需修改通道名和子图位置
# ...

plt.show()

代码运行结果如下:


在上图中,也可以更好的看出 RGB 颜色空间的加法属性。例如,没有 B 通道的子图大部分是黄色的,这是因为 绿色+红色 会得到黄色值。

2. 图像的几何变换

几何变换主要包括缩放、平移、旋转、仿射变换、透视变换和图像裁剪等。执行这些几何变换的两个关键函数是 cv2.warpAffine()cv2.warpPerspective()
cv2.warpAffine() 函数使用以下 2 x 3 变换矩阵来变换源图像:
d s t ( x , y ) = s r c ( M 11 x + M 12 y + M 13 , M 21 x + M 22 y + M 23 ) dst(x,y)=src(M_{11}x+M_{12}y+M_{13}, M_{21}x+M_{22}y+M_{23}) dst(x,y)=src(M11x+M12y+M13,M21x+M22y+M23)
cv2.warpPerspective() 函数使用以下 3 x 3 变换矩阵变换源图像:
d s t ( x , y ) = s r c ( M 11 x + M 12 y + M 13 M 31 x + M 32 y + M 33 , M 21 x + M 22 y + M 23 M 31 x + M 32 y + M 33 ) dst(x,y)=src(\\frac {M_{11}x+M_{12}y+M_{13}} {M_{31}x+M_{32}y+M_{33}}, \\frac {M_{21}x+M_{22}y+M_{23}} {M_{31}x+M_{32}y+M_{33}}) dst(x,y)=src(M31x+M32y+M33M11x+M12y+M13,M31x+M32y+M33M21x+M22y+M23)
接下来,我们将了解最常见的几何变换技术。

2.1 缩放图像

缩放图像时,可以直接使用缩放后图像尺寸调用 cv2.resize()

# 指定缩放后图像尺寸
resized_image = cv2.resize(image, (width * 2, height * 2), interpolation=cv2.INTER_LINEAR)

除了上述用法外,也可以同时提供缩放因子 fxfy 值。例如,如果要将图像缩小 2 倍:

# 使用缩放因子
dst_image = cv2.resize(image, None, fx=0.5, fy=0.5, interpolation=cv2.INTER_AREA)

如果要放大图像,最好的方法是使用 cv2.INTER_CUBIC 插值方法(较耗时)或 cv2.INTER_LINEAR。如果要缩小图像,一般的方法是使用 cv2.INTER_LINEAR
OpenCV 提供的五种插值方法如下表所示:

插值方法原理
cv2.INTER_NEAREST最近邻插值
cv2.INTER_LINEAR双线性插值
cv2.INTER_AREA使用像素面积关系重采样
cv2.INTER_CUBIC基于4x4像素邻域的3次插值
cv2.INTER_LANCZOS4正弦插值

显示缩放后的图像:

def show_with_matplotlib(color_img, title, pos):
    # Convert BGR image to RGB
    img_RGB = color_img[:,:,::-1]
    ax = plt.subplot(1, 3, pos)
    plt.imshow(img_RGB)
    plt.title(title,fontsize=8)
    # plt.axis('off')
show_with_matplotlib(image, 'Original image', 1)
show_with_matplotlib(dst_image, 'Resized image', 2)
show_with_matplotlib(dst_image_2, 'Resized image 2', 3)
plt.show()

可以通过坐标系观察图片的缩放情况:

2.2 平移图像

为了平移对象,需要使用 NumPy 数组创建 2 x 3 变换矩阵,其中提供了 xy 方向的平移距离(以像素为单位):

M = np.float32([[1, 0, x], [0, 1, y]])

其对应于以下变换矩阵:
[ 1 0 t x 0 1 t y ] \\begin{bmatrix} 1 & 0 & t_x \\\\ 0 & 1 & t_y \\end{bmatrix} [1001txty]
创建此矩阵后,调用 cv2.warpAffine() 函数:

dst_image = cv2.warpAffine(image, M, (width, height))

cv2.warpAffine() 函数使用提供的 M 矩阵转换源图像。第三个参数 (width, height) 用于确定输出图像的大小。
例如,如果图片要在 x 方向平移 200 个像素,在 y 方向移动 30 像素:

height, width = image.shape[:2]
M = np.float32([[1, 0, 200], [0, 1, 30]])
dst_image_1 = cv2.warpAffine(image, M, (width, height))

平移也可以为负值,此时为反方向移动:

M = np.float32([[1, 0, -200], [0, 1, -30]])
dst_image_2 = cv2.warpAffine(image, M, (width, height))

显示图片如下:

2.3 旋转图像

为了旋转图像,需要首先使用 cv.getRotationMatrix2D() 函数来构建 2 x 3 变换矩阵。该矩阵以所需的角度(以度为单位)旋转图像,其中正值表示逆时针旋转。旋转中心 (center) 和比例因子 (scale) 也可以调整,使用这些元素,以下方式计算变换矩阵:
[ α β ( 1 − a ) ⋅ c e n t e r . x − β ⋅ c e n t e r . y − β α β ⋅ c e n t e r . x − ( 1 − α ) ⋅ c e n t e r . y ] \\begin{bmatrix} \\alpha & \\beta & (1-a)\\cdot center.x-\\beta\\cdot center.y \\\\ -\\beta & \\alpha & \\beta\\cdot center.x-(1-\\alpha)\\cdot center.y \\end{bmatrix} [αββα(1a)center.xβcenter.yβcenter.x(1α)center.yOpenCV-Python实战(19)——OpenCV与深度学习的碰撞

《Nuitka打包实战指南》实战打包OpenCV-Python

《Nuitka打包实战指南》实战打包OpenCV-Python

OpenCV-Python实战(番外篇)——OpenCV中绘制模拟时钟显示当前时间

OpenCV-Python实战(番外篇)——OpenCV中利用鼠标事件动态绘制图形

OpenCV-Python实战(番外篇)——利用 SVM 算法识别手写数字