机器学习中的照片 OCR 算法
Posted
技术标签:
【中文标题】机器学习中的照片 OCR 算法【英文标题】:Algorithms for Photo OCR in Machine Learning 【发布时间】:2012-08-26 02:15:06 【问题描述】:我最近在 coursera 上学习了机器学习课程,并以不错的成绩通过了该课程。我在课程中使用了 KNN、Logistic Regression、NN 等算法,其中一项任务是编写我能够完成的数字识别学习算法。课程以 Photo OCR 的案例研究结束,这让我非常兴奋,但我发现很难应用课程中教授的基本算法来解决这个巨大的问题。所以有人可以建议我一些关于 Photo OCR 的算法吗?
【问题讨论】:
【参考方案1】:图像识别的问题在于它对任何变化都非常敏感。他们平均人脑能够从图像中提取某些特征,即使应用了某些图像操作(例如倾斜、旋转等),我们也可以识别给定图像。
话虽如此,据我所知,人工神经网络是使用最广泛的(通常添加一两个隐藏层也有帮助)。我听说过的另一种技术是 Wisard(或向导),但我找不到任何关于它的信息。这种技术基本上将图像分成多个部分,然后在将图像片段与您的知识库中的图像片段进行比较时,您可以获得一定百分比的相似度。
话虽如此,如果我在你的位置上我会坚持使用神经网络加上一个不错的图形处理库,例如 OpenCV(有各种包装器,包括 Java 和 C#)。目的是尽可能多地消除不需要的信息。例如,在某些情况下,将图像缩小为灰度或严格的黑白像素会有所帮助。
【讨论】:
以上是关于机器学习中的照片 OCR 算法的主要内容,如果未能解决你的问题,请参考以下文章
Python/OpenCV - 基于机器学习的 OCR(图像到文本)
ng机器学习视频笔记(十六) ——从图像处理谈机器学习项目流程