开源文字识别软件tesseract
Posted zbfamily
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了开源文字识别软件tesseract相关的知识,希望对你有一定的参考价值。
1.下载4.0软件,下一步下一步到成功;
2.安装之后配置环境变量,Path中添加安装路径(默认:C:Program Files (x86)Tesseract-OCR)
3.新增语言库的环境变量,变量名:TESSDATA_PREFIX,变量值(默认:C:Program Files (x86)Tesseract-OCR essdata)
4.测试软件是否可用tesseract -v,能看到版本号就说明安装成功了
5.识别图片的文字(tesseract [in image] [out txt] [lange],如未指定语言,则默认为英文字体库识别)
中文字体库识别:tesseract d:1.png result -l chi_sim,
英文字体库识别:tesseract d:1.png result,
tesseract 4.0中文字库和安装软件(安装时自带英文字库)
百度网盘:https://pan.baidu.com/s/1TiD2Tdez5JVbAhri8cumLA
密码:5mem
以上是关于开源文字识别软件tesseract的主要内容,如果未能解决你的问题,请参考以下文章