机器学习入门-轮廓系数 聚类效果的评估

Posted my-love-is-python

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习入门-轮廓系数 聚类效果的评估相关的知识,希望对你有一定的参考价值。

聚类评估:轮廓系数

计算样本到同簇其他样本的平均距离ai, ai越小,说明样本越应该被聚类到该簇

计算样本到其他簇样本的平均距离bi,这个称为样本与簇Cj的不相似度

s(i) = (b(i) - a(i)) / max(b(i), a(i))

si 接近1, 说明b(i) 远大于a(i), 说明分类的越合理

si接近0, 说明b(i) == a(i), 即样本分布在分类边界的边缘

si等于-1,说明分类越不合理

 

以上是关于机器学习入门-轮廓系数 聚类效果的评估的主要内容,如果未能解决你的问题,请参考以下文章

机器学习sklearn----通过轮廓系数确定适合的n_clusters

机器学习sklearn----通过轮廓系数确定适合的n_clusters

机器学习sklearn----通过轮廓系数确定适合的n_clusters

[机器学习与scikit-learn-26]:算法-聚类-KMeans寻找最佳轮廓系数

sklearn聚类算法评估方法 之各种系数

聚类效果评估内部指标(Jaccard系数FM指数Rand指数)外部指标(DB指数Dunn指数)轮廓系数(Silhouette Coefficient)