pytesseract文字识别

Posted 2020-11-26 pythonclass

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了pytesseract文字识别相关的知识，希望对你有一定的参考价值。

import pytesseract
from PIL import Image

im=Image.open(‘image.png‘)
print(pytesseract.image_to_string(im))

安装注意：
　　环境变量需要配置两处
　　1、path
　　2、TESSDATA_PREFIX

初始路径

pytesseract.pytesseract.tesseract_cmd = ‘d://Tesseract-OCR//tesseract.exe‘
tessdata_dir_config = ‘--tessdata-dir "d://Tesseract-OCR//tessdata"‘

图像切割识别

im = Image.open(old_file)
R,C = im.size
newR = C//7
if right != 0:
    box = (left, low, right, high)
else:
    box = (left,low,R,high)
region = im.crop(box)
s = pytesseract.image_to_string(region,lang=‘chi_sim‘)

以上是关于pytesseract文字识别的主要内容，如果未能解决你的问题，请参考以下文章

pytesseract+Tesseract-OCR图片文字识别

Python+pytesseract+Tesseract-OCR图片文字识别（只适合新手）

centos 下使用 pytesseract 识别文字

Python 识别图片文字

听说你想学最近火爆的自动化Python办公——pyautogui控制鼠标键盘自动化操作，pytesseract进行图片文字识别，搭配上os文件管理，re正则过滤简直爽爆了

Python配置图片文字识别