使用Pytesseract+Tesseract-OCR识别图片的简单步骤

Posted yaoczz

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Pytesseract+Tesseract-OCR识别图片的简单步骤相关的知识,希望对你有一定的参考价值。

1.首先安装Pytesseract,这个很简单,直接输入命令 pip install pytesseract即可

技术图片

2.Tesseract-OCR https://pan.baidu.com/s/1sVYyKcPclZxWfFJDjy471g 提取码:5ib2 这个我也是在网上找到,可以直接下载使用

下载好后去修改pytesseract.py中的内容如下图

技术图片

3.pycharm中验证是否成功,注意:这里的图片是相对路径,我放到了pycharm里面

from PIL import Image
import pytesseract
image = pytesseract.image_to_string(Image.open("1.png"))
print(image)
看到下图识别成功,这个识别率不是很高,网上还有很多的方法,需要慢慢研究改正。

技术图片

 


 


 

以上是关于使用Pytesseract+Tesseract-OCR识别图片的简单步骤的主要内容,如果未能解决你的问题,请参考以下文章

我对 pytesseract 有疑问

pytesseract库的安装和使用

如何在 pytesseract 中使用经过训练的数据?

Pytesseract:FileNotFound

PyTesseract - 将 OCR 限制为一组字符

如何使用 Pytesseract 文本识别改进 OCR?