ocr和图像预处理技术

Posted

技术标签:

【中文标题】ocr和图像预处理技术【英文标题】:ocr and image preprocessing techniques 【发布时间】:2011-05-10 00:00:16 【问题描述】:

大家好,我有一组类似于汽车牌照照片的图像。

我想知道如何在将图像发送到 OCR 引擎以确定文本之前对其进行预处理。

我希望最终能够仅在车牌的白色内容上裁剪输入。

实际图像如下所示:

最终应该是这样的(颜色深度不重要)

感谢您的帮助。 问候, 鲍勃

【问题讨论】:

【参考方案1】:

分割图像(看看this)。

使用灰度阈值对片段进行分类(因为您只是在寻找白色)。

使用白色段边界框(或边界框,如果它分解为多个段)裁剪图像。 这可能不适用于白色汽车 - 但为这种情况建立一些规则应该不会太难。

查看tesseract-ocr提取文本。

【讨论】:

我已经在研究 tesseract 了,它工作得很好.. 一旦图像处理工作良好:) 有什么问题就问吧:) 嗨@VitorBraga 我已经使用了图像链接代码段,但是当我尝试在os x 的终端中使用带有./segment 0.5 500 20 js.jpeg rs.jpeg 的段命令时,我遇到了一个名为terminate called throwing an exceptionAbort trap: 6 的错误。你会帮我摆脱它吗?你能给我一些关于我错在哪里的信息吗?请帮我解决这个问题:) 我遇到了几乎相同的问题,请参阅this 问题我卡住的地方并解决我迄今为止尝试过的问题。还有我给出并接受但无法正常工作的答案:(

以上是关于ocr和图像预处理技术的主要内容,如果未能解决你的问题,请参考以下文章

Python图像处理之图片文字识别(OCR)

实时图像处理(OCR)[关闭]

OCR 图像预处理

用于文档 OCR/可读性的图像处理/增强算法?

改进 OCR/图像识别的预处理

OCR技术浅探(转)