图像的文本检测
Posted
技术标签:
【中文标题】图像的文本检测【英文标题】:Text detection of image 【发布时间】:2011-02-05 07:52:29 【问题描述】:我得到了廉价相机制作的灰度图像,我需要制作一个程序 OCR。 主要问题是噪声或不是文本但它们存在于二进制图像中的对象。 现在我想到了从图像中提取文本。
我需要一些好的算法。 你能推荐一个非常好的吗? 例如,如果图像包含黑色文本和类似黑线的东西 那么该算法将只选择没有行的文本。
【问题讨论】:
OCR 已经有一段时间了。您有什么理由需要构建自己的,而不是寻找现有的工具?至于算法,我相信有很多。通常,您需要有要搜索的字符的现有模板,然后让程序查看图像中是否存在这些模板。 如果图像包含清晰的文本,即使手写文本的 ocr 对这些图像也不是很好,其他工具也可以工作。我试过 tesseract google,gocr。字符模板是什么意思? @maxiumus:OCR 系统需要一些参考点,它需要知道正确的“A”是什么样子才能识别出可能是“A”的图像”。实现这一目标的方法可能不止一种,所建议的只是其中一种方法。 这个问题与***.com/questions/1848/locating-text-within-image重复 你可能会看这里:***.com/questions/1284214/… 【参考方案1】:您描述了两种要消除的噪音。 (顺便说一句,用于降噪的wikipedia page 还不错,请查看“图像中”部分)。
一种是奇点噪声。这通常被称为“斑点”或“椒盐”噪声,通常被某种平均滤波器去除。 mathworks 有一个很好的页面描述了一些算法。
第二种是线条。这更难,我不会真正将其描述为噪声,它取决于您输入的图像类型。 This paper 似乎很合适,但它不是在线免费提供的,因此您可能需要购买它或去当地的大学图书馆。
你可能还想看看this,它可以从很多地方下载,但它确实是用于电影(视频)的,所以可能不是你想要的。
【讨论】:
以上是关于图像的文本检测的主要内容,如果未能解决你的问题,请参考以下文章