tesseract-ocr安装问题

Posted zrmw

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了tesseract-ocr安装问题相关的知识,希望对你有一定的参考价值。

今天安装tesseract-ocr的时候,载了坑,记录一下。

1. 安装时语言库的选择,我把 aditional language data 这一项全选中了,装的时候那叫一个慢啊,差不多3个小时装好的。如果不是必要的话,建议选择其中的一部分去安装。

2. 安装好了,在命令行里直接输入 “tesseract“  也是没有问题,但是在实际使用的过程中,总是报错。如下

Traceback (most recent call last):
  File "C:/Users/Administrator/******.py", line 6, in <module>
    print(tesserocr.image_to_text(image))
  File "tesserocr.pyx", line 2400, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: C:ProgramDataAnaconda3

最简单的解决方法,一个是检查环境变量的问题。

另一个就是,将C:Program Files (x86)Tesseract-OCR目录(tesseract-ocr默认安装目录)下的tessdata文件夹拷贝到C:ProgramDataAnaconda3目录,就是报错信息的最后,那个目录。

有问题可以留言,可能解决方法并不适用各种情况,大家一起研究。

以上是关于tesseract-ocr安装问题的主要内容,如果未能解决你的问题,请参考以下文章

tesseract-ocr安装问题

在 CentOS 6 上安装 Tesseract-OCR

Python图片文字识别——Windows下Tesseract-OCR的安装与使用

tesseract-OCR + pytesseract安装

linux安装Tesseract-OCR

windows vs 编译tesseract-ocr