集群的代表实例——层次聚类

Posted

技术标签:

【中文标题】集群的代表实例——层次聚类【英文标题】:Representative instance of a cluster - hierarchical clustering 【发布时间】:2016-02-17 18:02:35 【问题描述】:

我正在使用凝聚层次聚类方法对一组数据进行聚类。我用于聚类的数据集是轨迹。 我使用自定义距离函数来估计轨迹之间的距离。 matlab代码如下: Z = links(ID,'single','@my_distfun');

聚类后的数据;我想找到具有代表性的实例(或轨迹)。

如何找到每个集群的代表性实例(轨迹)?

【问题讨论】:

【参考方案1】:

层次聚类没有代表性实例的概念。

你必须自己决定一个定义。

例如,您可以使用与所有其他元素的平均距离最小的元素。或者平均 squared 距离最小的那个,或者...许多其他选项。

“代表”是一个主观术语。

【讨论】:

谢谢匿名。我打算使用代表实例来计算聚类评估的平方误差标准之和。您是否建议任何其他内部聚类评估标准来评估结果聚类? 这些标准都不适合我。 手动评估是唯一有效的方法。

以上是关于集群的代表实例——层次聚类的主要内容,如果未能解决你的问题,请参考以下文章

使用python从混淆矩阵进行层次聚类

基于它们在python中的合并顺序的层次聚类标签

python实现一个层次聚类方法

具有自定义距离的层次聚类

张伟伟-层次1 Mean_shift聚类算法和其他的聚类算法

R:层次聚类分析-dist、hclust、heatmap等