开源文字识别软件tesseract

Posted zbfamily

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了开源文字识别软件tesseract相关的知识,希望对你有一定的参考价值。

1.下载4.0软件,下一步下一步到成功;

2.安装之后配置环境变量,Path中添加安装路径(默认:C:Program Files (x86)Tesseract-OCR)

技术分享图片

3.新增语言库的环境变量,变量名:TESSDATA_PREFIX,变量值(默认:C:Program Files (x86)Tesseract-OCR essdata)

4.测试软件是否可用tesseract -v,能看到版本号就说明安装成功了

技术分享图片

5.识别图片的文字(tesseract [in image]  [out txt[lange],如未指定语言,则默认为英文字体库识别

中文字体库识别:tesseract d:1.png  result  -l chi_sim

技术分享图片

英文字体库识别:tesseract d:1.png result,

技术分享图片

 

 

tesseract 4.0中文字库和安装软件(安装时自带英文字库)

 百度网盘:https://pan.baidu.com/s/1TiD2Tdez5JVbAhri8cumLA

密码:5mem

以上是关于开源文字识别软件tesseract的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract-OCR-03-图片文字识别

验证码识别 Tesseract的简单使用和总结

开源OCR识别库-Tesseract介绍

Windows下使用Tesseract进行OCR文字识别

Tesseract-OCR 安装中文识别与训练字库

Tesseract 3.02 OCR文字识别调查记录