查找具有内容的区域并获取其边界矩形

Posted

技术标签:

【中文标题】查找具有内容的区域并获取其边界矩形【英文标题】:Find area with content and get its bouding rect 【发布时间】:2019-10-20 14:29:05 【问题描述】:

我正在使用 OpenCV 4 - python 3 - 在黑白图像中查找特定区域。

此区域不是 100% 填充的形状。它可能会缩小白线之间的一些差距。

这是我开始处理的基础图像:

这是我期望的矩形 - 用 Photoshop 制作 - :

我用霍夫变换线得到的结果 - 不准确 -

所以基本上,我从第一张图片开始,我希望在第二张图片中找到你看到的内容。

知道如何获取第二张图片的矩形吗?

【问题讨论】:

请考虑参观并阅读帮助中心 (***.com/help) 中的信息指南。如果您 (1) 自己展示一些研究成果,并且 (2) 学习如何提问,则用户更有可能提供帮助。请参阅下面的答案。 【参考方案1】:

我想介绍一种仅使用 NumPy 的 nonzero 函数的方法,它在计算上可能比 fmw42's answer 中的解决方案更便宜。基本上,找到两个轴的所有非零索引,然后获得最小值和最大值。因为我们这里有二进制图像,所以这种方法效果很好。

让我们看看下面的代码:

import cv2
import numpy as np

# Read image as grayscale; threshold to get rid of artifacts
_, img = cv2.threshold(cv2.imread('images/LXSsV.png', cv2.IMREAD_GRAYSCALE), 0, 255, cv2.THRESH_BINARY)

# Get indices of all non-zero elements
nz = np.nonzero(img)

# Find minimum and maximum x and y indices
y_min = np.min(nz[0])
y_max = np.max(nz[0])
x_min = np.min(nz[1])
x_max = np.max(nz[1])

# Create some output
output = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
cv2.rectangle(output, (x_min, y_min), (x_max, y_max), (0, 0, 255), 2)

# Show results
cv2.imshow('img', img)
cv2.imshow('output', output)
cv2.waitKey(0)
cv2.destroyAllWindows()

我从 fmw42 的答案中借用了裁剪后的图像作为输入,我的输出应该是相同的(或最相似的):

希望(也)有所帮助!

【讨论】:

这是一个非常酷的方法!我将阅读有关非零函数的更多信息。非常感谢。 @HansHirse。不错的方法。对于此图像,非零像素的最小和最大位置是一个好主意。但我预计,如果图像中还有其他白色区域,它将无法正常工作。需要进行某种过滤,例如形态学或使用轮廓区域。 @fmw42 嗯,你是对的 - 我没有考虑过。不幸的是,我也找不到使用这种方法的通用解决方案,它也涵盖了“盒子”,例如具有类似x,但不同y 范围。所以,我的解决方案确实仅限于某些用例。【参考方案2】:

在 Python/OpenCV 中,您可以使用形态学连接图像的所有白色部分,然后得到外轮廓。请注意,我已经修改了您的图像,以从您的屏幕快照中删除顶部和底部的部分。

import cv2
import numpy as np

# read image as grayscale
img = cv2.imread('blackbox.png')

# convert to grayscale
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# threshold
_,thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY)

# apply close to connect the white areas
kernel = np.ones((75,75), np.uint8)
thresh = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel)

# get contours (presumably just one around the outside) 
result = img.copy()
contours = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
contours = contours[0] if len(contours) == 2 else contours[1]
for cntr in contours:
    x,y,w,h = cv2.boundingRect(cntr)
    cv2.rectangle(result, (x, y), (x+w, y+h), (0, 0, 255), 2)

# show thresh and result    
cv2.imshow("thresh", thresh)
cv2.imshow("Bounding Box", result)
cv2.waitKey(0)
cv2.destroyAllWindows()

# save resulting images
cv2.imwrite('blackbox_thresh.png',thresh)
cv2.imwrite('blackbox_result.png',result)

输入:

形态学后的图像:

结果:

【讨论】:

这就像一个魅力,我永远不会建议解决问题的方法,谢谢!【参考方案3】:

这里是对@fmw42's answer 的轻微修改。这个想法是将所需区域连接成一个轮廓非常相似,但是您可以直接找到边界矩形,因为只有一个对象。使用相同的裁剪输入图像,结果如下。

我们也可以选择提取 ROI

import cv2

# Grayscale, threshold, and dilate
image = cv2.imread('3.png')
original = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

# Connect into a single contour and find rect
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5,5))
dilate = cv2.dilate(thresh, kernel, iterations=1)
x,y,w,h = cv2.boundingRect(dilate)
ROI = original[y:y+h,x:x+w]
cv2.rectangle(image, (x, y), (x+w, y+h), (36, 255, 12), 2)

cv2.imshow('image', image)
cv2.imshow('ROI', ROI)
cv2.waitKey()

【讨论】:

绝妙的方法!非常感谢

以上是关于查找具有内容的区域并获取其边界矩形的主要内容,如果未能解决你的问题,请参考以下文章

查找覆盖原始矩形的旋转矩形的大小

贵州省行政边界数据在哪免费下载

查找具有最大表面积的边界框轮廓,不包括相交区域

查找图像内的边缘(矩形的边界)

C ++ Opencv重新缩放边界矩形

UIView 的边界矩形可以大于框架矩形是不是有意义?