Python提取图片中的文字

Posted H3rmesk1t

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python提取图片中的文字相关的知识,希望对你有一定的参考价值。

Python提取图片中的文字

相关依赖库安装

pip install PIL
pip install pytesseract

OCR工具安装

下载链接

修改 pytesseract 源码中的路径,将 tesseract_cmd 的值改为安装Tesseract-OCR应用程序路径


安装识别中文所需依赖库,下载链接
将下载的中文库放在 Tesseract-OCR 安装目录下的 tessdata 文件夹中

识别代码

import pytesseract
from PIL import Image
 
img_en = Image.open(r'C:\\Users\\95235\\Downloads\\misc1\\misc1.png')
img_ch = Image.open(r'C:\\Users\\95235\\Downloads\\misc1\\misc1.png')
 
print('========识别字母========')
print(pytesseract.image_to_string(img_en))
 
print('========识别中文========')
print(pytesseract.image_to_string(img_ch, lang='chi_sim'))


以上是关于Python提取图片中的文字的主要内容,如果未能解决你的问题,请参考以下文章

Python提取图片中的文字

基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)

Python案例OCR提取图片中的文字

Python案例OCR提取图片中的文字

Python案例OCR提取图片中的文字

人口普查分析:利用python+百度文字识别提取图片中的表格数据