google 的 tesseract-OCR 中使用哪种算法进行识别？

Posted 2023-04-17

技术标签:

【中文标题】google 的 tesseract-OCR 中使用哪种算法进行识别？【英文标题】：Which algorithm is used in google's tesseract-OCR for Recognition? 【发布时间】：2017-11-09 03:14:49 【问题描述】：

google 的 tesseract-OCR 识别用的是什么算法？是神经网络吗？

【问题讨论】：

【参考方案1】：

the tesseract source 中的This paper 提供了对该技术的深入概述。

值得注意的是：

Blob 被组织成文本行，行和区域是分析固定间距或比例文本。

[...]

识别然后作为两遍过程进行。在第一关，一个尝试依次识别每个单词。每一个字是满意的作为训练数据传递给自适应分类器。这然后自适应分类器有机会更准确地识别页面下方的文字。

[...]

找到文本行后，基线会更适合精确地使用二次样条。

[...]

通过将 blob 划分为组来拟合基线原始直线基线的合理连续位移。将二次样条拟合到人口最多的分区，（假设作为基线）通过最小二乘拟合。

这篇论文没有明确说明它是否使用了神经网络，但考虑到内容我会说它很可能，至少在其中的一部分。

有关寻线的更多信息，请参阅R。史密斯，“一种通过文本行累积的简单有效的倾斜检测算法”，Proc。第三诠释。会议。关于文档分析和识别（第 2 卷），IEEE 1995，第 1145-1148 页。

【讨论】：

感谢您的链接:) @ChiroOdhora 您能否接受它（在投票箭头下方打勾），这样它就不会再“未答复”了？ :)【参考方案2】：

基于tesseract github repo 的About 部分：