如何在 python-tesseract 中设置 tessedit_write_images?

Posted

技术标签:

【中文标题】如何在 python-tesseract 中设置 tessedit_write_images?【英文标题】:How to set tessedit_write_images in python-tesseract? 【发布时间】:2015-10-12 04:41:51 【问题描述】:

我正在尝试设置tessedit_write_images,但似乎做不到,我在任何地方都看不到 tessinput.tif

我在做:

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_TESSERACT_ONLY)
api.SetPageSegMode(tesseract.PSM_AUTO_OSD)
api.SetVariable("tessedit_write_images", "T")

但我尝试过使用“True”、“1”和其他一些变体,似乎根本不起作用。

有什么帮助吗?

【问题讨论】:

【参考方案1】:

tessedit_write_images 在 Tesseract 的源代码中只检查一次(由 TessBaseAPI::ProcessPage() 进行,参见 here)。

所以你有两种方法:

    调用api.GetThresholdedImage(),如果设置变量并调用ProcessPage,返回的图像将被保存。 只需调用api.ProcessPage(),它就会看到变量并输出tif。

【讨论】:

如何通过mac终端设置这些参数?我已经下载了 Tesseract 并通过命令行使用它,所以当你说“你应该调用这样那样的方法”时,我不确定你的意思。我该怎么做? 重要的是,由于这个硬编码路径“tessinput.tif”,tif 文件将被写入您的工作目录,与outputbase 命令行选项无关。

以上是关于如何在 python-tesseract 中设置 tessedit_write_images?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Netbeans 中设置环境变量?

如何在 Android 中设置 libsvm?

如何在 Laravel 中设置全局变量?

如何在代码中设置绑定?

如何在协议扩展中设置委托

如何在预览中设置环境对象