如何区分 2 类:图像上的数字和“其他字母和噪声”?
Posted
技术标签:
【中文标题】如何区分 2 类:图像上的数字和“其他字母和噪声”?【英文标题】:How to differentiate 2 classes: digits and "other letters and noise" on an image? 【发布时间】:2015-04-04 03:56:16 【问题描述】:我开发了一种图像识别算法,可以帮助从现实世界中找到脏面板上的字符。其实图片是一个车牌,里面有字母、数字和泥。
算法必须将字符分为两类:字母字符和数字。是否可以训练 LBP 或 Haar 级联来区分这两个类,由于数字形状的变化,训练结果会稳定吗?
您能简单解释一下或推荐更好的方法吗?
【问题讨论】:
【参考方案1】:“算法必须将字符分为两类:字母字符和数字。” - 尽管从技术上讲,您忘记了泥土和背景,但您可以将它们添加到广泛的类别“其他”中。Haars 级联用于面部检测之类的东西,因为它们通常在面部具有特征的中间空间尺度上近似小波。您的问题是不同的。你需要首先了解你的问题结构,阅读文献,然后才尝试使用学习算法的纯粹力量。这个book实际上谈到了人们开始首先考虑方法而不是分析问题,这并不总是好主意。
从技术上讲,您首先需要在图像中找到文本,这比识别它更具挑战性,因为当前最先进的 OCR 通常用作库而不是从头开始创建。要在图像中查找文本,我建议首先进行自适应阈值处理以创建二进制映射(1-前景是字母和数字,0 是背景),然后在前景上执行连接组件加上 SWT(笔画宽度变换)http://research.microsoft.com/pubs/149305/1509.pdf
【讨论】:
以上是关于如何区分 2 类:图像上的数字和“其他字母和噪声”?的主要内容,如果未能解决你的问题,请参考以下文章