使用 OpenCV 检测文本块以发送到 Tesseract iOS

Posted

技术标签:

【中文标题】使用 OpenCV 检测文本块以发送到 Tesseract iOS【英文标题】:Use OpenCV to detect text blocks to send to Tesseract iOS 【发布时间】:2014-02-21 23:00:36 【问题描述】:

如何使用 OpenCV 检测图像中的所有文本,我希望能够单独检测文本的“块”。然后将识别的块传递给 tesseract。这是一个例子,如果我要扫描这个,我想单独扫描段落,而不是像 tesseract 那样从左到右。

Image of the example

【问题讨论】:

user2518618 接受的答案很棒。我想评论一下,tesseract 还可以为您提供数据,而不仅仅是文本。因此,您可以遍历数据并单独考虑每个块(block_number)(通过在行之间添加换行符和文本片段之间的空格来自己重构文本)。 【参考方案1】:

那将是我的第一个测试:

对图像设置阈值以获得黑白图像,文本为黑色 腐蚀它,直到段落转换为大块为止。它可能有很多洞,没关系。 查找轮廓和边界框

如果某些段落合并,你应该在侵蚀后减少侵蚀或扩大一点。

【讨论】:

以上是关于使用 OpenCV 检测文本块以发送到 Tesseract iOS的主要内容,如果未能解决你的问题,请参考以下文章

如何使用opencv从图像中检测文本

文本检测实战:使用OpenCV实现文本检测(EAST 文本检测器)

文本检测实战:使用OpenCV实现文本检测(EAST 文本检测器)

使用Python,OpenCV应用EAST文本检测器检测自然场景图像中的文本

文本的检测识别实战:使用 Tesseract 进行 OpenCV OCR 和文本识别

10分钟上手,OpenCV自然场景文本检测(Python代码+实现)