在 Tesseract 上获取文本方向 - Python API

Posted

技术标签:

【中文标题】在 Tesseract 上获取文本方向 - Python API【英文标题】:Getting Text Orientation on Tesseract - Python API 【发布时间】:2014-10-01 17:21:47 【问题描述】:

我正在使用 Tesseract Python Wrapper 来获取文本图像的方向。当我使用 Tesseract-OCR(不是 API)时,将模式设置为 -psm 0 有效,但我不知道如何在使用包装器时提取该信息。 我看过文档,我尝试使用方法 AnalyseLayout,但我似乎没有找到正确的方法。有什么想法吗??

谢谢!

【问题讨论】:

嗨,你能做到吗?怎么做到的?谢谢。 【参考方案1】:

以下是如何在 Java 中执行此操作。我想 Python 应该是类似的。

    IntBuffer orientation = IntBuffer.allocate(1);
    IntBuffer direction = IntBuffer.allocate(1);
    IntBuffer order = IntBuffer.allocate(1);
    FloatBuffer deskew_angle = FloatBuffer.allocate(1);
    int success = api.TessBaseAPIRecognize(handle, null);
    if (success == 0) 
        TessAPI.TessPageIterator pi = api.TessBaseAPIAnalyseLayout(handle);
        api.TessPageIteratorOrientation(pi, orientation, direction, order, deskew_angle);
    

【讨论】:

我尝试在 Python 中做到这一点,但我无法很好地定义方法 Orientation 的参数。还是谢谢!

以上是关于在 Tesseract 上获取文本方向 - Python API的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract,openCV,python:如何获取句子或同一行文本的边界框?

如何使用 Tesseract 获取图像文本 [关闭]

Tesseract API - 获取每个带有位置的文本框

获取 Tesseract 中每个单词的位置

文本的检测识别实战:使用 Tesseract 进行 OpenCV OCR 和文本识别

Tesseract ocr PDF 作为输入