梵文 OCR(印地语 / 马拉地语 / 梵语)

Posted

技术标签:

【中文标题】梵文 OCR(印地语 / 马拉地语 / 梵语)【英文标题】:OCR for Devanagari (Hindi / Marathi / Sanskrit) 【发布时间】:2011-01-05 22:24:48 【问题描述】:

有人知道最近使用现代机器学习技术对印度文字进行光学字符识别的工作吗?我知道在加尔各答的 ISI 进行了一些研究,但据我所知,在过去 3-4 年中没有任何新的发现,而且很遗憾地缺乏天城文的 OCR!

【问题讨论】:

谷歌学者给了我很多关于“ocr 印地语”的点击。也许你可以选择其中一篇论文并给作者发电子邮件,询问他们是否可以指出仍在解决这些问题的地方/人 付费OCR软件可用,indsenz.com/int/index.php?content=download_area 关于建议的问题在这里是题外话。它应该在softwarerecs.stackexchange.com 【参考方案1】:

仅供参考:有一个 2003 年的 article in the New York Times 引用了一个名为 ILT 的工具。

【讨论】:

【参考方案2】:

这肯定太老了,无法使用,但很酷:a video 来自 Ingalls 的梵文和 OCR 演讲。 (Daniel H. H. Ingalls, Sr.,梵文教授和翻译,他的儿子Dan Ingalls,参与 Smalltalk 等的计算机科学家。)前半部分是 Ingalls Sr. 描述一个自动分析文本的项目,第二部分是 Ingalls Jr. 描述如何他从头开始为梵文实现 OCR。

【讨论】:

一位匿名用户提议将此链接添加到答案中:tdil-dc.in/eocr/index.html(我认为它的目的是作为一个单独的答案,而不是对此答案的编辑,所以我将离开它这里)

以上是关于梵文 OCR(印地语 / 马拉地语 / 梵语)的主要内容,如果未能解决你的问题,请参考以下文章

马拉地语未在浏览器中正确显示

在codenameone中获得服务响应中的问号

导出为 pdf 时如何正确呈现印地语?

订购印地语字符

没有从图像中获取印地语文本

如何在 jsp 文件中使用印地语内容? [复制]