提高低质量扫描图像的OCR质量
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了提高低质量扫描图像的OCR质量相关的知识,希望对你有一定的参考价值。
在自动校正和裁剪后,我有以下图像:
我需要OCR这个图像。现在ABBYY Engine SDK 11 For Linux产生的效果不是很好:
IMerasers - www,raiyirnieti'^C9,co;i,ni
Clariiis: Jv ocl'ca :PO 9ox 30998, S&M Luke C6y, UT 84":30
Guslomei: Service: 952-945-800G or 800-952-3^55
Jieaf5ftg: impaired; VA
Pharmaaisto: 853-364-6331
Medica Pfovic.&s: 80 ;j-2i5S-55"',2 o ■ www.rfledica.cori
^ofricai'or Services: 86i-7<5-9920
t1 ^edHoaiihca'Q Provicors; 6 77-842420 or
; mffiffiF********
Sviet iea Be tsvio a rieofift:
Mocica Ca-linK frwso ,'ne: 430-962-9*9?
可以将哪些自动图像预处理技术应用于此图像以提高OCR质量?或者无法提高此图像的OCR质量?现在我使用OpenCV和Leptonica库来预处理图像。
更新
这是原始图片:
答案
图像已经以相对较低的分辨率和噪声进行二值化。
你可以稍微改进它
- 分辨率加倍或三倍(有或没有双线性插值,这几乎没有差别);
- 平滑(小高斯滤波器,中位数......);
- 再次二进制化。
但是你几乎无法恢复,伤害已经完成。最有可能的是,预处理会使结果恶化。
另一答案
正如Yves所说,图像的质量非常低。不过,您应该能够改善您的结果:
- 尝试调整图像大小。一些OCR期望特定尺寸的字母
- 尝试其他OCR,如tesseract
- 如果您必须阅读许多具有相同字体的文档,则可以使用该字体训练OCR
以上是关于提高低质量扫描图像的OCR质量的主要内容,如果未能解决你的问题,请参考以下文章