使用 leptonica 进行 OCR 图像处理(反色文本)

Posted

技术标签:

【中文标题】使用 leptonica 进行 OCR 图像处理(反色文本)【英文标题】:Image processing for OCR with leptonica (inverse color text) 【发布时间】:2012-07-25 14:02:52 【问题描述】:

我正在尝试使用 leptonica 处理以下图像以使用 tesseract 提取文本。

原图:

原始图像上的 Tesseract 会产生这样的结果:

i s l
D2J1FiiE-l191x1iitmwii9 uhiaiislz-2 Q ~37
Bottom linez
With a little time!
you can learn social media technology
using free online resources-
And if you donity
youlll be at a significant disadvantage
to
other HOn-pFOiiTS-

不是很好,尤其是顶部背景。所以使用 leptionica 我使用背景去除算法(模糊、差异、阈值、反转)来获得以下图像:

但是 tesseract 并没有很好地处理它:

@@r-mair lkrm@W lh@w ilr@ mJs@ iklh@ ii@c2lhm1@ll
mm Mime
VWU1 a Mitt-Jle time-
@1m ll@@Wn Om @@@lh1
using free onhne resources-
Andifyoudoni
9110 ate a $0 D
to other non-profrts
I

主要问题似乎是现在所有的文本都是轮廓而不是实体。我该如何调整我的算法,或者我可以添加什么来使文本更稳固?

【问题讨论】:

【参考方案1】:

看来这篇论文提出了一种解决你问题的二值化方法:

T Kasar、J Kumar 和 A G Ramakrishnan。 Font and Background Color Independent Text Binarization。 (2007)

【讨论】:

太好了。在我接受答案之前,您不会碰巧知道该算法的实现吗? 不,很遗憾我不知道是否存在实现。 我用python和opencv做了一个实现。谢谢! github.com/jasonlfunk/ocr-text-extraction 这是一项巨大的努力,看起来很有希望,但现在文本看起来像是从某个档案中挖出来的,基本上文本对读者来说并不像你在最右边看到的那样清晰可见( c)

以上是关于使用 leptonica 进行 OCR 图像处理(反色文本)的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract-OCR编译及ViewerDebugging使用

Leptonica在VS2010中的编译及简单使用举例

linux安装Tesseract-OCR

OCR:图像到文本?

Leptonica 与 Xcode 框架冲突

mac下安装tesseract-OCR