数据聚类如何帮助图像或模式识别

Posted

技术标签:

【中文标题】数据聚类如何帮助图像或模式识别【英文标题】:how does data clustering help in image or pattern recognition 【发布时间】:2010-11-29 00:08:54 【问题描述】:

我一直在使用不同的数据聚类算法来寻找代表节点的随机数据点之间的聚类,我一直在阅读数据聚类用于图像识别。我无法建立联系,聚类数据如何帮助识别图像或面部识别。有人可以解释一下吗?

【问题讨论】:

【参考方案1】:

聚类被广泛用于模式识别,尤其是图像识别,这并不奇怪:聚类是一个缩减过程,这个百万像素时代的图像需要沸腾...... 产生类别的过程,这当然很有用。

但是,有许多方法可以将聚类用作图像识别技术。这种多样性的原因之一是聚类可以应用于不同的级别,用于不同的目的:从基本像素级别到特征级别(特征是一条线,几何图形......),用于分类或其他目的。

在非常高的层次上,聚类是一种统计工具,它有助于发现各个维度在定义特定项目属于特定类别时的相对重要性。

一个 [of many] 使用这种工具的方法是监督学习,其中一组人工选择的项目(比如图像)与与特定项目关联的标签(“这是一个苹果”、“这是另一个苹果”、“这是一个柠檬”......)一起被馈送到基于集群的逻辑中,聚类逻辑然后确定输入的每个维度对于帮助每组项目(苹果、柠檬......)在不同的聚类中的重要性(例如,颜色可能相对无关紧要,但形状或点的存在,或任何可能很重要的东西)。在这个训练阶段之后,可以将新图像输入到逻辑中,并通过查看该图像与特定集群的距离有多近,它被“识别”(作为香蕉!)。

当涉及到图像处理时,需要记住,“馈入”聚类逻辑的任何东西不一定(事实上,很少)是原始像素,而是各种“对象” 表征原始数据的各种“元素”(本质上是相对高维向量的集合,与在其他数据聚类示例中可能遇到的一些不同),并由过程的先前阶段产生。例如,面部识别的一个重要元素可能是眼睛中心之间的确切距离。在之前的阶段,图像的处理方式是确定眼睛的位置(可能依赖于另一个基于聚类的逻辑)。然后眼睛之间的距离以及许多其他元素被输入到最终的聚类逻辑中。

前面的描述只是使用聚类进行图像识别的一个例子。事实上,在这个领域已经非常成功地使用了各种形式的神经网络,并且可以说在某种意义上这些神经网络是聚类信息。神经网络成功的原因之一可能在于它们能够更加尊重原始输入中的 locality 维度,以及它们以分层方式工作的能力.

这篇文章的一个很好的结论是一个简短的在线资源列表,但我现在时间紧迫......“待续”;-)

次日编辑:(未能提供关于该主题的介绍性在线参考书目)

我对应用于人工视觉和图像处理的聚类主题的文献搜索发现了两个不同的...聚类;-)

图像处理和计算机视觉算法 J Parkey pub Wiley 或Machine Vision : Theory, Algorithms, Practicalities M Seul 等书籍。艾尔剑桥大学。这类书籍一般涵盖了与降噪、边缘检测、颜色或强度转换以及图像处理链的许多其他元素相关的所有重要技术,其中大多数不涉及聚类甚至统计方法,它们只保留一章或在应用于模式识别或其他任务时,两次甚至很少提及聚类。 学术论文和会议手册,专门涵盖应用于人工视觉等的聚类技术,但以最窄和最深入的方式(例如:用于字符识别的 Fukunaga 和 Narendra 算法的变体,或用于选择的快速方法在任何情况下的最近邻候选者。)

简而言之,我觉得自己没有能力提出任何具体的书籍或文章建议。

您可能会发现通过“人工视觉”或“图像识别”或上面提到的一些或某些标题来浏览 Google 图书中的标题会提供丰富的信息。借助“关于这本书”链接中的预览功能和标签云(顺便说一句,集群的另一个应用程序),人们可以很好地了解各种书籍的内容,并可能决定购买其中的一些。不幸的是,读者人数的减少和该领域潜在的有利可图的应用使这些书相对昂贵。另一方面,您可以下载讨论该领域高级主题的研究论文,有时是免费的。这些也将显示在常规(网络)Google 上,或在专门的存储库中,例如 CiteSeer。

祝您在该领域的探索顺利!

【讨论】:

ty,等待下一部分

以上是关于数据聚类如何帮助图像或模式识别的主要内容,如果未能解决你的问题,请参考以下文章

图像处理、模式识别、计算机图形学之间的相互关系

AI开发者指南丨如何正确理解神经网络和深度学习?

模式识别与机器学习

常见聚类算法

Node.js 或 PHP 中的模式识别算法?

织物缺陷图像识别算法研究