带有神经网络的 OCR:数据提取

Posted

技术标签:

【中文标题】带有神经网络的 OCR:数据提取【英文标题】:OCR with Neural network: data extraction 【发布时间】:2011-01-29 19:00:26 【问题描述】:

我正在使用 AForge 库框架及其神经网络。

当我训练我的网络时,我创建了很多大尺寸(30 pt)的图像(每个字母一个图像),剪下实际的字母,将其缩小到更小的尺寸(10x10 px)然后保存到我的硬盘。然后我可以去阅读所有这些图像,用数据创建我的 double[] 数组。目前我以像素为单位进行此操作。

因此,一旦我成功训练了我的网络,我就会测试网络并让它在具有不同大小(大写和小写)字母的样本图像上运行。

但结果并不乐观。我对网络进行了训练,使 RunEpoch 的误差约为 1.5(因此几乎没有错误),但仍然有一些字母在我的测试图像中无法正确识别。

现在我的问题是:这是因为我的学习方法有误(基于像素与本文中建议使用的受体:http://www.codeproject.com/KB/cs/neural_network_ocr.aspx - 我可以使用其他方法来提取网络数据吗? ) 还是因为我从图像中提取要查看的字母的分割算法不好而发生这种情况?

有人对如何改进有想法吗?

【问题讨论】:

【参考方案1】:

我会尝试使您的网络输入规模不变。换句话说,对您在测试图像中找到的对象进行预处理,以分割出单个候选字母对象,并将它们的大小调整为与您的训练集相同的大小。根据您的描述,您没有这样做。我对 AForge 不熟悉,所以您的问题可能暗示了这一点。

我在神经网络方面的经验是,如果有一种已知的好方法,对输入数据进行预处理通常会产生更好的结果。这里好像有。

【讨论】:

以上是关于带有神经网络的 OCR:数据提取的主要内容,如果未能解决你的问题,请参考以下文章

OpenCV实现车牌识别,OCR分割,ANN神经网络

处理 OCR 的验证码

OCR识别要依赖于深度学习的进展吗?

适用于 .net 的免费 OCR SDK,可以将文本、带有格式和图像的表格提取到 Office word 文档中 [关闭]

字符识别OCR研究一(模板匹配&BP神经网络训练)

如何制作 OCR 程序? [关闭]