tesseract 环境 linux
Posted maoxianfei
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了tesseract 环境 linux相关的知识,希望对你有一定的参考价值。
python 环境
wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
chmod o+x Miniconda3-latest-Linux-x86_64.sh
pip install Pillow
pip install pytesseract
pip install xlwt
pip install requests
centos7安装依赖库
-
安装centos系统依赖
yum install -y automake autoconf libtool gcc gcc-c++ yum install -y libpng-devel libjpeg-devel libtiff-devel
-
安装leptonica
wget http://www.leptonica.org/source/leptonica-1.72.tar.gz tar xvzf leptonica-1.72.tar.gz cd leptonica-1.72/ ./configure make && make install
-
安装tesseract-ocr
wget https://github.com/tesseract-ocr/tesseract/archive/3.04.zip unzip 3.04.zip cd tesseract-3.04/ ./configure make && make install ldconfig 报错:error while loading shared libraries: libtesseract.so.3
-
部署模型
- 在https://github.com/tesseract-ocr/tessdata 下载对应语言的模型文件
- 将模型文件移动到/usr/local/share/tessdata
-
安装requirements.txt中的python依赖库
pip install -r requirements.txt
tesseract配置
-
在/usr/local/share/tessdata创建eng.user-patterns写入
表示识别6位字符(或数字)
-
在/usr/local/share/tessdata/configs创建myconfig写入
#识别白名单 tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz0123546789 #用户正则模式匹配 user_patterns_suffix user-patterns
以上是关于tesseract 环境 linux的主要内容,如果未能解决你的问题,请参考以下文章
docker中基于centos7.3搭建tesseract5环境以及制作镜像