获取 Tesseract 中每个单词的位置

Posted

技术标签:

【中文标题】获取 Tesseract 中每个单词的位置【英文标题】:Getting the position of each word in Tesseract 【发布时间】:2018-10-03 16:05:52 【问题描述】:

如下图:Like this picture

从图像中提取文本(我知道)后,我想获取每个单词在 Tesseract 中的位置然后:首先: 在每个字母周围画一个蓝色矩形(exp :“the”或“quick”)第二:在每个单词周围画一个红色矩形(例如:“the”或“quick” 另外,我怎样才能得到图片中行和列字的位置?我需要它为每个单词添加一个 3D 对象。 我在 c# 中使用 EmguCV 请帮助我如何做到这一点。

【问题讨论】:

听起来像是功课。 @Greg 你能帮帮我吗? 【参考方案1】:

您已使用Tesseract OCR .NET Wrapper Demo 应用程序附加了一张图片。

这是使用tessnet2 程序集的示例。它是 Tesseract 引擎 的包装器。关于这个库的更多信息是here 和here。

但您应该了解tessnet 2 程序集与Tesseract v 2.x(和datasets)兼容。

因此,如果您正在寻找使用支持语言列表的更全面的库版本的解决方案,您可能需要努力工作。

【讨论】:

感谢您的回复。是的,我使用 tesseract 库,而我的问题是如何在单词上绘制一个矩形(如图所示)。我需要一个例子。伪代码或 C# 语言中的任何内容。我在 emgucv 中使用 tesseract Taking bounds - 就是这样。检索到单词的边界框后,您可以根据最小值和最大值绘制一个矩形。

以上是关于获取 Tesseract 中每个单词的位置的主要内容,如果未能解决你的问题,请参考以下文章

Android OCR 使用 tess-two 一个 tesseract 的分支

Tesseract - 错误 net.sourceforge.tess4j.Tesseract - null

Tesseract 加载语言失败 (Tess4j / Java / Netbeans)

android怎么调用tesseract实现OCR功能?

Tess-Two(Android 中的 Tesseract OCR)显示非常不准确的结果

Tesseract API - 获取每个带有位置的文本框