市场上可用的开源 OCR 工具 [关闭]

Posted

技术标签:

【中文标题】市场上可用的开源 OCR 工具 [关闭]【英文标题】:Open source OCR tool available in the market [closed] 【发布时间】:2010-09-16 20:24:50 【问题描述】:

是否有任何用 .NET 编写的开源 OCR 库,或者用任何语言编写但可以在 ASP.NET 应用程序中使用? 或者市场上是否有任何开源 OCR API 可用于将图像转换为表格格式?

【问题讨论】:

【参考方案1】:

使用Tessnet。

Tessnet 是适用于 .NET 2.0 的 tessdll(和 tesseract)的 C++/CLI .NET Wrapper。

【讨论】:

【参考方案2】:

有 Tesseract,虽然它没有原生 .net 绑定,但它非常完整。

“值得关注的”是OCRopus - 由 Google 赞助的项目,尚未准备好投入生产。

【讨论】:

OCROpus 可以使用 Tesseract 引擎,并做一些布局分析和其他图像预处理。【参考方案3】:

对于它的价值,还有GOCR。没试过。

【讨论】:

【参考方案4】:

我相信,Tesseract OCR 是由 HP 开发并开源的。我不确定质量有多好。

【讨论】:

【参考方案5】:

正如其他人正在编写的那样,Tesseract 是一个很好的开源 OCR 实现。

尽管它很好,但它只是一个 OCR 引擎。它不进行布局检测。如果您的输入不是纯文本,您可能必须自己弄清楚布局。

【讨论】:

以上是关于市场上可用的开源 OCR 工具 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

中文开源 OCR [关闭]

最准确的日语开源 OCR? [关闭]

是否有适用于 Android 和 iOS 的 OCR 开源库或 sdk(免费)? [关闭]

tesseract-ocr图片识别开源工具

免费-开源-简洁天若OCR文字识工具使用介绍

PaddleSlim重磅开源SlimX系列小模型,覆盖人脸识别分类检测和OCR