阿里云图片识别orc

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了阿里云图片识别orc相关的知识,希望对你有一定的参考价值。

参考技术A 文档地址:
https://help.aliyun.com/document_detail/295361.html

开发主要看API参考就可以了。
阿里云给你封装好了SDK,后台可以直接看SDK,如下图:

sdk地址:
https://next.api.aliyun.com/api-tools/sdk/ocr-api?version=2021-07-07&language=java-tea

具体参数说明,可以看api的公共参数。

ORC相关的库介绍和应用

将图像翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR)

OCR库:Pillow、Tesseract、NumPy

Pillow

Pillow可以对图片进行预处理,比如图片背景色不是纯白,而是渐进色,那么就可以利用Pillow进行预处理得到相对清晰的图片来提供给Tesseract去识别。

Tesseract

Tesseract可以通过训练识别出任何字体(要求字体风格保持不变)

安装Tesseract

Tesseract不是python的库,所以不是通过import的方式导入,而是需要去下载安装,截至目前最新版本是 3.02.02。下载地址

简体中文字库文件下载地址为:http://download.csdn.net/detail/wanghui2008123/7621567

下载完成后解压,然后将该文件剪切到tessdata目录下去就可以了。字库文件:chi_sim.traineddata

Tesseract默认安装在C盘,默认安装是不是会自动添加环境变量,我没试。

我是安装在F盘  F:\\Program Files\\Tesseract-OCR。安装成功后,再去设置一下环境变量,把安装的路劲加到环境变量里就好了,或者执行指令:

#setx TESSDATA_PREFIX F:\\Program Files\\Tesseract OCR\\

安装的步骤我就不赘述了,安装的过程中出现失败的情况,没有关系,继续就OK。

接着去CMD指令界面中输入:C:\\Users\\Administrator>tesseract

如果出现下面的结果,那就是安装成功了!

为了验证下是否能识别成功,我在D盘根目录下放了一张图片

然后在cmd指令界面中输入如下指令:

C:\\Users\\Administrator>tesseract e:\\img.jpg e:\\img -l chi_sim

结果:(img默认是txt格式)

泪崩~

这识别是个什么几把玩意啊???不管识别的怎么样,人家也是识别了一部分不是?

NumPy

NumPy 并非解决OCR 问题时必须使用的库,但是如果你想训练Tesseract 识别,那么就会用到它。NumPy 是一个非常强大的库,具有大量线性代数以及大规模科学计算的方法。

 

以上是关于阿里云图片识别orc的主要内容,如果未能解决你的问题,请参考以下文章

调用阿里云的通用文字识别-高精版识别接口,识别图片中的文字详解

利用深度学习框架Tensorflow做图像识别(基于阿里云PAI)

阿里云Ocr识别封装

人脸识别应用解析

印刷文字识别-身份证识别(阿里云)

ORC相关的库介绍和应用