阿里云图片识别orc

Posted 2023-04-25

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了阿里云图片识别orc相关的知识，希望对你有一定的参考价值。

参考技术A 文档地址：
https://help.aliyun.com/document_detail/295361.html

开发主要看API参考就可以了。
阿里云给你封装好了SDK，后台可以直接看SDK，如下图：

sdk地址：
https://next.api.aliyun.com/api-tools/sdk/ocr-api?version=2021-07-07&language=java-tea

具体参数说明，可以看api的公共参数。

ORC相关的库介绍和应用

将图像翻译成文字一般被称为光学文字识别（Optical Character Recognition，OCR）

OCR库：Pillow、Tesseract、NumPy

Pillow

Pillow可以对图片进行预处理，比如图片背景色不是纯白，而是渐进色，那么就可以利用Pillow进行预处理得到相对清晰的图片来提供给Tesseract去识别。

Tesseract

Tesseract可以通过训练识别出任何字体（要求字体风格保持不变）

安装Tesseract

Tesseract不是python的库，所以不是通过import的方式导入，而是需要去下载安装，截至目前最新版本是 3.02.02。下载地址

简体中文字库文件下载地址为:http://download.csdn.net/detail/wanghui2008123/7621567

下载完成后解压，然后将该文件剪切到tessdata目录下去就可以了。字库文件：chi_sim.traineddata

Tesseract默认安装在C盘，默认安装是不是会自动添加环境变量，我没试。

我是安装在F盘 F:\\Program Files\\Tesseract-OCR。安装成功后，再去设置一下环境变量，把安装的路劲加到环境变量里就好了，或者执行指令：

#setx TESSDATA_PREFIX F:\\Program Files\\Tesseract OCR\\

安装的步骤我就不赘述了，安装的过程中出现失败的情况，没有关系，继续就OK。

接着去CMD指令界面中输入：C:\\Users\\Administrator>tesseract

如果出现下面的结果，那就是安装成功了！

为了验证下是否能识别成功，我在D盘根目录下放了一张图片

然后在cmd指令界面中输入如下指令：

C:\\Users\\Administrator>tesseract e:\\img.jpg e:\\img -l chi_sim

结果：（img默认是txt格式）

泪崩~

这识别是个什么几把玩意啊？？？不管识别的怎么样，人家也是识别了一部分不是？

NumPy

NumPy 并非解决OCR 问题时必须使用的库，但是如果你想训练Tesseract 识别，那么就会用到它。NumPy 是一个非常强大的库，具有大量线性代数以及大规模科学计算的方法。

以上是关于阿里云图片识别orc的主要内容，如果未能解决你的问题，请参考以下文章

调用阿里云的通用文字识别-高精版识别接口，识别图片中的文字详解

利用深度学习框架Tensorflow做图像识别（基于阿里云PAI）