机器学习入门-轮廓系数 聚类效果的评估
Posted my-love-is-python
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习入门-轮廓系数 聚类效果的评估相关的知识,希望对你有一定的参考价值。
聚类评估:轮廓系数
计算样本到同簇其他样本的平均距离ai, ai越小,说明样本越应该被聚类到该簇
计算样本到其他簇样本的平均距离bi,这个称为样本与簇Cj的不相似度
s(i) = (b(i) - a(i)) / max(b(i), a(i))
si 接近1, 说明b(i) 远大于a(i), 说明分类的越合理
si接近0, 说明b(i) == a(i), 即样本分布在分类边界的边缘
si等于-1,说明分类越不合理
以上是关于机器学习入门-轮廓系数 聚类效果的评估的主要内容,如果未能解决你的问题,请参考以下文章
机器学习sklearn----通过轮廓系数确定适合的n_clusters
机器学习sklearn----通过轮廓系数确定适合的n_clusters
机器学习sklearn----通过轮廓系数确定适合的n_clusters
[机器学习与scikit-learn-26]:算法-聚类-KMeans寻找最佳轮廓系数
聚类效果评估内部指标(Jaccard系数FM指数Rand指数)外部指标(DB指数Dunn指数)轮廓系数(Silhouette Coefficient)