在python中使用opencv剪切图像的特定部分

Posted 2023-02-25

技术标签:

【中文标题】在python中使用opencv剪切图像的特定部分【英文标题】：cut out a specific part of an image with opencv in python 【发布时间】：2020-04-29 09:00:38 【问题描述】：

我有一张 IC 芯片的图像，我想剪掉中心的标记。标记始终位于左下角圆圈上方的特定位置。这个想法是首先找到我已经通过霍夫圆变换完成的圆位置。现在我想剪掉标记所在的部分。理想情况下，它应该不是正方形或矩形，而是更像图像中的东西：

这是我的代码的一部分：

        cimg = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
        circles = cv2.HoughCircles(morph_image, cv2.HOUGH_GRADIENT, 1.3, 20, param1=50, param2=25, minRadius=15,
                                   maxRadius=19)

        if circles is not None:
            circles = np.uint16(np.around(circles))
            for i in circles[0, :]:
                # Zeichne äußeren Kreis
                cv2.circle(cimg, (i[0], i[1]), i[2], (0, 255, 0), 2)
                # Zeichne Kreiszentrum
                cv2.circle(cimg, (i[0], i[1]), 2, (0, 0, 255), 3)
                # Tupel mit x- und y-Koordinaten des Kreiszentrums
                circle_center = (i[0], i[1])
                print('Die Koordinaten des Kreiszentrums lauten: ', circle_center)
                """cv2.imshow('Kreis', cimg)
                cv2.waitKey(0)
                cv2.destroyAllWindows()"""
        else:
            circle_center = None
            print('Kein Kreis gefunden')
            """cv2.imshow('Kein Kreis', cimg)
            cv2.waitKey(0)
            cv2.destroyAllWindows()"""

所以我的cicle center 具有我圈子的中心位置（例如(124, 370)）。如何自动剪切图像的这一部分？我可以以某种方式裁剪出来吗？理想情况下，我想将标记裁剪到另一张图像中以单独检查，但我猜marking_img = img[y:y+h, x:x+w] 的正常裁剪方法行不通。

编辑：这是原图：

输出应该和第一张图片一样，如果可能的话：

所以最后我想要两张图像：一张只有模具没有标记的图像和一张只有标记的图像

【问题讨论】：

你能附上预期的输出吗？我添加了原始图像和预期输出为什么不在阈值化后使用 tesseract 读取文本并使用形态学进行清理。或者提取所有字符并使用轮廓边界框仅保留中间的字符。如果文本比您的顶部和底部符号更宽（在 x 方向上），那么您可以阈值并使用形态学来连接 3 行文本并提取 3 个较大的边界框。 @fmw42 因为有些图像由于激光不良或某种划痕而无法读取字符。但无论如何，我都想剪掉这 3 行。对我来说有趣的部分是模具的表面，我只想要表面。对于可以使用 tessaract 的进一步任务，需要将标记裁剪成新图像。但是这 3 行会比你的顶部和底部图标宽吗？如果是这样，可以这样做以将它们裁剪掉。是否总是有 3 行且只有 3 行？ 3 行中每一行中的字符数是否总是相同的长度（6、3 和 5）？ 【参考方案1】：

这是 Python/OpenCV 中的一种方式。

阅读图片阅读蒙版（与您的另一张图片分开创建一次）将蒙版转换为灰色并将其阈值化为二进制，将其反转并使其成为 3 个通道从您自己的代码中获取圆心。（我只是手动测量的）设置文本区域底部与圆心的预期 x,y 偏移量从圆心计算蒙版的预期左上角、蒙版图像的偏移量和高度将蒙版放入与该位置输入大小相同的黑色图像中将新蒙版应用于图像以使图像的其余部分变黑从左上角裁剪出感兴趣区域和原始蒙版的大小（可选）裁剪原始图像保存结果

输入图片：

准备好的蒙版图片：

import cv2
import numpy as np

# read image
img = cv2.imread('die.jpg')
ht, wd, cc = img.shape

# read mask as grayscale
mask = cv2.imread('die_mask.png', cv2.IMREAD_GRAYSCALE)

# threshold mask and invert
mask = cv2.threshold(mask,0,255,cv2.THRESH_BINARY)[1]
mask = 255 - mask
hh, ww = mask.shape

# make mask 3 channel
mask = cv2.merge([mask,mask,mask])

# set circle center
cx = 62
cy = 336

# offsets from circle center to bottom of region
dx = -20
dy = -27

# compute top left corner of mask using size of mask and center and offsets
left = cx + dx
top = cy + dy - hh

# put mask into black background image
mask2 = np.zeros_like(img)
mask2[top:top+hh, left:left+ww] = mask

# apply mask to image
img_masked = cv2.bitwise_and(img, mask2)

# crop region
img_masked_cropped = img_masked[top:top+hh, left:left+ww]

# ALTERNATE just crop input
img_cropped = img[top:top+hh, left:left+ww]

cv2.imshow('image', img)
cv2.imshow('mask', mask)
cv2.imshow('mask2', mask2)
cv2.imshow('masked image', img_masked)
cv2.imshow('masked cropped image', img_masked_cropped)
cv2.imshow('cropped image', img_cropped)
cv2.waitKey(0)
cv2.destroyAllWindows()

# save results
cv2.imwrite('die_mask_inserted.jpg', mask2)
cv2.imwrite('die_masked_image.jpg', img_masked)
cv2.imwrite('die_masked_cropped.jpg', img_masked_cropped)
cv2.imwrite('die_cropped.jpg', img_cropped)

插入黑色图像的蒙版：

蒙面图片：

蒙版图像的裁剪：

（可选）输入图像的裁剪：

【讨论】：

谢谢！该示例有效:) 但是当我将它添加到我现有的代码中时，它显示ValueError: could not broadcast input array from shape (175,226,3) into shape (0,44) 所以一个图像通道存在问题。我作为原始输入提供的图像已预先进行了预处理。它最初是一个较大的图像，有时会旋转，所以我裁剪它并旋转它以获得我提供的输入图像。但我会查查这个问题。再次感谢！

以上是关于在python中使用opencv剪切图像的特定部分的主要内容，如果未能解决你的问题，请参考以下文章