Tesseract的路径错误

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Tesseract的路径错误相关的知识,希望对你有一定的参考价值。

我以为我会让Tesseract在我的Win 7机器上工作:

from PIL import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

tessdata_dir_config = '--tessdata-dir "C:\Program Files (x86)\Tesseract-OCR\tessdata"'

myFile = r"D:	empOCR
ightness_of_rendering.tif"

print(pytesseract.image_to_string(Image.open(myFile)))

tesseract.exe位于C: Program Files(x86) Tesseract-OCR tesseract.exe中

eng.traineddata位于C: Program Files(x86) Tesseract-OCR tessdata

我得到的错误是

D:LearnPython>D:LearnPythonocr_test.py
Traceback (most recent call last):
  File "D:LearnPythonocr_test.py", line 14, in <module>
    print(pytesseract.image_to_string(Image.open(myFile)))
  File "C:Python27libsite-packagespytesseractpytesseract.py", line 125, in
image_to_string
    raise TesseractError(status, errors)
pytesseract.pytesseract.TesseractError: (1, u'Error opening data file \Program
Files (x86)\Tesseract-OCR\eng.traineddata')

D:LearnPython>

这是一个目录,所以我有点困惑,如何设置它以便它将正常工作。

答案

来自pytesseract github page

tessdata_dir_config = '--tessdata-dir "<replace_with_your_tessdata_dir_path>"'
# Example config: '--tessdata-dir "C:\Program Files (x86)\Tesseract-OCR\tessdata"'
# It's important to add double quotes around the dir path.

pytesseract.image_to_string(image, lang='chi_sim', config=tessdata_dir_config)

请注意,您需要在config=tessdata_dir_config电话中提供image_to_string

因此,如果您使用的是英国数据,那就是

print(pytesseract.image_to_string(Image.open(myFile), lang='eng', config=tessdata_dir_config))

以上是关于Tesseract的路径错误的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract的路径错误

使用pytesseract识别验证码,报错WindowsError: [Error 2]

tesseract 图片验证测试错误,如何处理error?

pytesseract 报windows err no2的错误

opencv tesseract 未定义的引用错误

从 tesseract 导入 image_to_string 时出现 Python 错误