pytesseract文字识别
Posted pythonclass
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pytesseract文字识别相关的知识,希望对你有一定的参考价值。
import pytesseract from PIL import Image im=Image.open(‘image.png‘) print(pytesseract.image_to_string(im))
安装注意:
环境变量需要配置两处
1、path
2、TESSDATA_PREFIX
初始路径
pytesseract.pytesseract.tesseract_cmd = ‘d://Tesseract-OCR//tesseract.exe‘
tessdata_dir_config = ‘--tessdata-dir "d://Tesseract-OCR//tessdata"‘
图像切割识别
im = Image.open(old_file) R,C = im.size newR = C//7 if right != 0: box = (left, low, right, high) else: box = (left,low,R,high) region = im.crop(box) s = pytesseract.image_to_string(region,lang=‘chi_sim‘)
以上是关于pytesseract文字识别的主要内容,如果未能解决你的问题,请参考以下文章
pytesseract+Tesseract-OCR图片文字识别
Python+pytesseract+Tesseract-OCR图片文字识别(只适合新手)
听说你想学最近火爆的自动化Python办公——pyautogui控制鼠标键盘自动化操作,pytesseract进行图片文字识别,搭配上os文件管理,re正则过滤简直爽爆了