OCR .NET 推荐 [关闭]
Posted
技术标签:
【中文标题】OCR .NET 推荐 [关闭]【英文标题】:OCR .NET Recommended [closed] 【发布时间】:2010-10-18 06:17:30 【问题描述】:您好,我刚刚在 .NET 中尝试了一个用于 OCR 的组件,结果非常不准确。以前有没有人走这条路?您能否为我推荐一条路径,以节省我评估许多产生不满意结果的组件的时间。
非常感谢任何建议。我不介意购买或自己编码。任何效果最好且具有成本效益的方法。
谢谢
【问题讨论】:
重复:***.com/questions/591574/ocr-in-net 【参考方案1】:我们在项目中使用了Abby Fine Reader SDK。它带有一个 COM 对象,您可以在 .Net 应用程序中使用它。引擎的成功已经足够了。
【讨论】:
对我们来说也是如此。 API 有一些陷阱,但结果真的很惊人。【参考方案2】:ABBYY 的组件非常昂贵。我评估了 Pegasus ImagXpress 和 Atalasoft DotImage,虽然我发现 DotImage 在整页 OCR 上更准确,但 ImagXpress 可以更好地阅读某些难以识别的小部分文本。 我建议您尝试两者的演示版本,看看最适合您的需求。
【讨论】:
【参考方案3】:有关替代引擎的信息,请参阅 https://***.com/a/18070183/852208。
您的准确性问题可能与库本身有关。但是,它更有可能是您正在使用的图像源。考虑以下tips:
文本考虑
不应在某些材料上尝试标准 OCR。例如,当前不应尝试使用默认设置的 OCR 在 1850 年之前出版的大多数文本上。对于某些语言(例如, 德语)截止日期可能更晚。在尝试创建之前 通过 OCR 对这些材料进行转录、详细分析和 通常需要进行实验来判断自定义之间的权衡 OCR 和键盘输入选项。 必须以 RGB 模式扫描旧文档和变色文档,以捕获所有图像数据,并最大限度地提高 OCR 准确性。 低对比度文档可能导致 OCR 不佳。 Typescript 导致的 OCR 比打印类型差;字体和大小的不一致使用会降低 OCR 的准确性。 原件中小于 6 磅的字体大小会限制 OCR,尽管将扫描图像的分辨率提高到 600 dpi 和 使用灰度可能会改善 OCR 输出。 无法以任何准确度识别手写文档。影响 OCR 准确性的扫描注意事项包括:
推荐的 OCR 精度的最佳扫描分辨率为 300 dpi。更高的分辨率不一定会带来更好的效果 准确性,并且可以减慢 OCR 处理时间。以下决议 300 dpi 可能会影响 OCR 结果的质量和准确性。 亮度设置过高或过低都可能对 OCR 准确性产生不利影响。 50% 的中等亮度值将是 适用于大多数情况。 初始扫描的直线度会影响 OCR 质量;弯曲的文字行会产生较差的效果。 必须以 RGB 模式扫描旧文档和变色文档,以捕获所有图像数据,并最大限度地提高 OCR 准确性。 图像增强功能(例如对比度调整和模糊蒙版)并未显示显着提高 OCR 的准确性。
【讨论】:
以上是关于OCR .NET 推荐 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章