基于R语言的分类、聚类研究

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于R语言的分类、聚类研究相关的知识,希望对你有一定的参考价值。

参考技术A 1.所有在对iris数据集分(聚)类研究中,setosa均可以完全正确分(聚)类,而另外两类则会出现不同程度的误差,这也是导致整个研究模型出现误差的原因;
2.在使用的三种分类研究方法中,决策树模型的效果最优,因此可以使用该方法进行鸢尾花数据集的分类预测研究。

1.在对鸢尾花数据集进行聚类时,K-means、K-medoids两种聚类方法的正确率相同,可见在数据集离群点和噪音不大的情况下,二者聚类效果基本相同,但当出现离群点和噪音时,应该考虑K-medoids聚类方法;
2.鸢尾花数据集进行聚类分析时,划分聚类效果优于层次聚类;
3.对于量纲不一致的数据,应进行标准化,但对于量纲一致的数据,标准化之后结果并不一定优于未标准化的数据得到的结果。

以上是关于基于R语言的分类、聚类研究的主要内容,如果未能解决你的问题,请参考以下文章

基于R语言利用NMF(非负矩阵分解)替代层次聚类进行肿瘤分型

R语言聚类分析之基于划分的聚类KMeans实战:基于菌株数据

R语言聚类分析之基于划分的聚类KMeans实战:基于葡萄酒数据

R语言应用实战-聚类分析以及k-means的优缺点

基于R语言的Kmeans聚类算法

基于R语言的数据挖掘之聚类算法--基于密度方法