OCR(tesseract),图像智能旋转

Posted

技术标签:

【中文标题】OCR(tesseract),图像智能旋转【英文标题】:OCR (tesseract), intelligent rotation for Image 【发布时间】:2013-08-31 11:55:38 【问题描述】:

我正在开发一个使用 tesseract OCR 识别文本的 android 应用程序,现在我遇到的问题是,在不同的智能手机上,图像以不同的方式旋转,所以一个它立即处于横向模式,另一个在纵向模式下。所以现在我想智能地旋转图像,以便 Tesseract 可以识别文本。这只是可能的两个选项之一,但由于用户拍照,它可能在任何一个选项中。我不希望用户每次都必须以相同的格式拍摄照片,我想旋转它以适应需要,如果可能的话,不会有太多的性能损失。

具有自动旋转功能的 Tesseract 库似乎不适用于我。 任何人都知道如何解决这个问题。

谢谢

【问题讨论】:

Tessarct 库没有提供自动旋转功能。你必须为此提出你的逻辑。 查看 Tesseract 的 Orientation and script detection (OSD) 示例。您可能对方向和偏斜角度感兴趣。您必须相应地旋转图像。 【参考方案1】:

如果这个问题仍然与您相关:也许您可以提取图像的 exif 数据,以获取其方向?

否则本文可能对您有所帮助:Combined Orientation and Script Detection using the Tesseract OCR Engine。

【讨论】:

【参考方案2】:

如果您不介意卷起袖子,http://www.leptonica.org/ 可能是评估字形(尚未检测为文本的原始 Pix)和确定方向的好选择。我已经看到对 Leptonica 的 Android 绑定的引用。

【讨论】:

以上是关于OCR(tesseract),图像智能旋转的主要内容,如果未能解决你的问题,请参考以下文章

android怎么调用tesseract实现OCR功能?

Tess-Two(Android 中的 Tesseract OCR)显示非常不准确的结果

android手机怎么调用OCR识别图像中的文字

Java OCR tesseract 图像智能字符识别技术

使用 Tesseract 的 Android OCR 应用程序

使用 tesseract 为 android