tesseract 环境 linux

Posted maoxianfei

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了tesseract 环境 linux相关的知识,希望对你有一定的参考价值。

python 环境

 wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh

chmod o+x Miniconda3-latest-Linux-x86_64.sh

pip install Pillow
pip install pytesseract
pip install xlwt
pip install requests

 

centos7安装依赖库

  • 安装centos系统依赖

    yum install -y automake autoconf libtool gcc gcc-c++ 
    yum install -y libpng-devel libjpeg-devel libtiff-devel
  • 安装leptonica

    wget http://www.leptonica.org/source/leptonica-1.72.tar.gz
    tar xvzf leptonica-1.72.tar.gz
    cd leptonica-1.72/ 
    ./configure 
    make && make install
  • 安装tesseract-ocr

    wget https://github.com/tesseract-ocr/tesseract/archive/3.04.zip
    unzip 3.04.zip
    cd tesseract-3.04/ 
    ./configure
    make && make install 
    ldconfig  报错:error while loading shared libraries: libtesseract.so.3
  • 部署模型

  • 安装requirements.txt中的python依赖库

    pip install -r requirements.txt

tesseract配置

  • 在/usr/local/share/tessdata创建eng.user-patterns写入

    
    
    
    
    
    
    

    表示识别6位字符(或数字)

  • 在/usr/local/share/tessdata/configs创建myconfig写入

    #识别白名单
    tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz0123546789
    #用户正则模式匹配
    user_patterns_suffix user-patterns

 




以上是关于tesseract 环境 linux的主要内容,如果未能解决你的问题,请参考以下文章

tesseract在linux环境怎么训练自己的字库

在linux下安装tesseract-ocr

docker中基于centos7.3搭建tesseract5环境以及制作镜像

docker中基于centos7.3搭建tesseract5环境以及制作镜像

tesseract 没有得到小标签

正方体 + OpenCV + linux