是否有可行的手写识别库/程序? [关闭]
Posted
技术标签:
【中文标题】是否有可行的手写识别库/程序? [关闭]【英文标题】:Is there a viable handwriting recognition library / program? [closed] 【发布时间】:2012-05-02 05:34:23 【问题描述】:我正在处理一堆扫描的回复明信片,上面有手写联系信息(即姓名、地址、电话、电子邮件等)。
我很好奇是否有可行的开源库或软件可以做到这一点(最好是 Java 或 R)。环顾四周,很多信息都是 2009 年或早期的,并不是很令人鼓舞。
语言是英语。
有什么建议吗?
编辑:我查看了 OCRopus 页面,但最新版本是 2009 年 5 月。有人对此有任何经验吗?或者有更新的版本吗?
【问题讨论】:
任何特定的语言? 我并没有真正得到这个问题的标记...... @DanW:Java 或 R 将是理想的选择。笔迹是英文的。 ***.com/questions/2693132/… ; ***.com/questions/6133410/… 机械土耳其人?或者将它们作为验证码文本添加到人们可能想要访问的内容中...... 【参考方案1】:我不知道有任何可用的开源手写识别库,尽管我已经在 OCR 领域工作了一段时间。通常手写比 OCR 更难,我会说甚至没有像样的商业解决方案。所有存在的都有自己的问题,并且只能在非常狭窄的应用程序中工作,例如字典有限、文本编写良好等。如果您仍然感兴趣,我建议您检查法国公司 I2IA 的技术
【讨论】:
【参考方案2】:您可能想查看http://code.google.com/p/ocropus/,这是一个开源 OCR 系统。
但是,它似乎是用 C++ 和 python 编写的。
*更新:*
由于其中一个研究项目是手写分析仪,我希望它可能会有所帮助。
OCRopus 引擎基于两个研究项目: 90 年代中期开发的高性能手写识别器 由美国人口普查局部署,新颖的高性能布局 分析方法。
如果您查看http://code.google.com/p/ocropus/source/browse/,源文件自 2011 年 10 月以来已更新(三个中的一个来自 2012 年 3 月),因此它目前似乎仍在开发中。
【讨论】:
OCRopus 不适用于手写识别【参考方案3】:首先,据我所知,没有本地开源 Java OCR SDK。有一些 Java API 封装了对本机接口的调用,tesjeract (http://code.google.com/p/tesjeract/) 或 Tess4J (http://tess4j.sf.net/)。
接下来,您需要指定是查找手写文本还是手写文本。如果您需要手写文本识别 - 由于其他答案中所述的原因,我不相信您将能够解决您的任务。
但是,如果您需要 ICR(代表智能字符识别)用于手写文本(在调查、表格等中使用的相当清晰的字母),则可能有解决方案。虽然我相信 tesseract(尽管被认为是开源引擎中最好的)在这里无法为您完成这项工作,但您可以寻找更准确的 SDK。
也许这个问题会有所帮助:Handwritten scanned Doc to .txt File?
【讨论】:
以上是关于是否有可行的手写识别库/程序? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章