市场上可用的开源 OCR 工具 [关闭]
Posted
技术标签:
【中文标题】市场上可用的开源 OCR 工具 [关闭]【英文标题】:Open source OCR tool available in the market [closed] 【发布时间】:2010-09-16 20:24:50 【问题描述】:是否有任何用 .NET 编写的开源 OCR 库,或者用任何语言编写但可以在 ASP.NET 应用程序中使用? 或者市场上是否有任何开源 OCR API 可用于将图像转换为表格格式?
【问题讨论】:
【参考方案1】:使用Tessnet。
Tessnet 是适用于 .NET 2.0 的 tessdll(和 tesseract)的 C++/CLI .NET Wrapper。
【讨论】:
【参考方案2】:有 Tesseract,虽然它没有原生 .net 绑定,但它非常完整。
“值得关注的”是OCRopus - 由 Google 赞助的项目,尚未准备好投入生产。
【讨论】:
OCROpus 可以使用 Tesseract 引擎,并做一些布局分析和其他图像预处理。【参考方案3】:对于它的价值,还有GOCR。没试过。
【讨论】:
【参考方案4】:我相信,Tesseract OCR 是由 HP 开发并开源的。我不确定质量有多好。
【讨论】:
【参考方案5】:正如其他人正在编写的那样,Tesseract 是一个很好的开源 OCR 实现。
尽管它很好,但它只是一个 OCR 引擎。它不进行布局检测。如果您的输入不是纯文本,您可能必须自己弄清楚布局。
【讨论】:
以上是关于市场上可用的开源 OCR 工具 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章