文字识别：CRNN

Posted 2021-01-22 allen-rg

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了文字识别：CRNN相关的知识，希望对你有一定的参考价值。

技术分享图片

来自： https://zhuanlan.zhihu.com/p/43534801

文字检测主要解决的问题是哪里有文字，文字的范围有多大，即定位文本行的所在位置和范围及其布局。

文本识别是在文本行定位的基础上，对文本行内容进行识别，将图像中的文本信息转化为文字信息。文字识别主要解决的问题是每个文字是什么。

所以一般来说，从自然场景图片中进行文本行识别，需要包括三个步骤：

技术分享图片图1 文字识别的步骤

本文的重点是如何对已经定位好的文本行图片进行识别。

常用文本行识别算法主要有两个框架：

CTC是一种Loss计算方法，用CTC代替Softmax Loss，训练样本无需对齐。

CTC特点：

这篇文章的核心，就是将CNN/LSTM/CTC三种方法结合：

提供了一种end2end文本行图片算算法。

以上是关于文字识别：CRNN的主要内容，如果未能解决你的问题，请参考以下文章