如何在 python-tesseract 中设置 tessedit_write_images?
Posted
技术标签:
【中文标题】如何在 python-tesseract 中设置 tessedit_write_images?【英文标题】:How to set tessedit_write_images in python-tesseract? 【发布时间】:2015-10-12 04:41:51 【问题描述】:我正在尝试设置tessedit_write_images
,但似乎做不到,我在任何地方都看不到 tessinput.tif
我在做:
import tesseract
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_TESSERACT_ONLY)
api.SetPageSegMode(tesseract.PSM_AUTO_OSD)
api.SetVariable("tessedit_write_images", "T")
但我尝试过使用“True”、“1”和其他一些变体,似乎根本不起作用。
有什么帮助吗?
【问题讨论】:
【参考方案1】:tessedit_write_images
在 Tesseract 的源代码中只检查一次(由 TessBaseAPI::ProcessPage()
进行,参见 here)。
所以你有两种方法:
-
调用
api.GetThresholdedImage()
,如果设置变量并调用ProcessPage
,返回的图像将被保存。
只需调用api.ProcessPage()
,它就会看到变量并输出tif。
【讨论】:
如何通过mac终端设置这些参数?我已经下载了 Tesseract 并通过命令行使用它,所以当你说“你应该调用这样那样的方法”时,我不确定你的意思。我该怎么做? 重要的是,由于这个硬编码路径“tessinput.tif”,tif 文件将被写入您的工作目录,与outputbase
命令行选项无关。 以上是关于如何在 python-tesseract 中设置 tessedit_write_images?的主要内容,如果未能解决你的问题,请参考以下文章