中文开源 OCR [关闭]

Posted

技术标签:

【中文标题】中文开源 OCR [关闭]【英文标题】:Open source OCR for Chinese [closed] 【发布时间】:2010-12-26 16:06:27 【问题描述】:

我搜索了中文的开源 OCR。但是如果没有任何运气,似乎很少有一些可用的开源 OCR(中文)。

所以我在这里想知道:

    有没有开源的中文OCR可以用于生产环境?

    为拉丁语言和中文实现 OCR 时的主要区别是什么?我知道一些好的OCR比如Tesseract或者Ocropus,如果我想让它支持中文怎么办?

任何帮助表示感谢并提前感谢~

【问题讨论】:

【参考方案1】:

您可以选择:

Tesseract 3.0 支持中文/日文 NHOCR 支持日语

【讨论】:

现在可以下载 Tesseract 3.0 了吗?我在哪里可以找到它的来源? 您可以查看code.google.com/p/tesseract-ocr/source/checkout。【参考方案2】:

中文的字符比拉丁语言多得多。有一些商业产品。其中一种方法是与他们联系并获得帮助。

我认为没有中文或日文字符的开源代码。在 OCR 领域,除了模式识别算法之外,还有很多技术是公司擅长的,而不是开源社区。

【讨论】:

我确实为日语找到了一些开源 OCR。似乎中文的选择不多。还是谢谢你~

以上是关于中文开源 OCR [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

市场上可用的开源 OCR 工具 [关闭]

最准确的日语开源 OCR? [关闭]

是否有适用于 Android 和 iOS 的 OCR 开源库或 sdk(免费)? [关闭]

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

专门为渲染文本设计开源 OCR 引擎(截图)

开源OCR识别库-Tesseract介绍