OCR 基本知识

Posted 2020-10-02 mfmdaoyou

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了OCR 基本知识相关的知识，希望对你有一定的参考价值。

OCR，optical character recognition 的简称，也就是光学识别系统，属于图形识别的一个分支，OCR是针对印刷体字符，採用光学的方式将文档资料转换成原始资料黑白点阵的图像文件，通过识别软件将图像中的文字识别成中文和英文内码，然后转换成文本格式。这样计算机就能够通过OCR识别系统。能够清楚自己看到了什么，读到了什么，尤其是文字资料。

（1）处理过程：
影像输入->影像前处理->文字特征的提取->对照识别->最后通过人工矫正将误判的文字更正，最后将结果输出。

（2）详细流程

1、影像输入：目标文件经过光学仪器后生成位图存储在计算机。

2、影像预处理：包含二值化、腐蚀与膨胀、中值滤波等。

图像二值化：图像显示的时候仅仅能看到两种颜色（常常是黑白两色）。

3、文字特征的提取：依据字符本身特点，在不同区域採集数据。

4、对照数据库：通过画板制作对应的字母和数字模板作为对照的标准。

5、对照识别：依据不用区域的特征比較，找出最相近的字符。

6、输出结果：将最相近的字符作为识别的结果输出。即识别码输出。

以上是关于OCR 基本知识的主要内容，如果未能解决你的问题，请参考以下文章

机器学习- 吴恩达Andrew Ng Week11 知识总结 Photo OCR

进行基本数字识别的最佳方法是啥？

tesseract-ocr tips

oracle 11g RAC 的一些基本概念

银行卡识别的知识与应用

ocr综述