R语言之实战分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言之实战分析相关的知识,希望对你有一定的参考价值。

参考技术A

采编自 DataMiningWithR

2.1 观察各个变量数据的规范性
几乎每个变量都有异常值存在,多是异常大值

2.2 观察变量间的相关性

2.3 双变量间的相关性
由上可知,"oPO4"和"PO4"高度相关,达到0.91

2.4 观察单个变量的数据分布情况

左图可明显判断异常值的存在,右图可展现数据在不同范围内的分布集中度

3.1 了解缺失值的基本分布情况

3.2 直接删除缺失值,在缺失值占比很少的情况采用

3.3 基于一定的规则填充缺失值

4.1 数据准备和聚类预览

初步判断,可分为4组

4.2 层次聚类

4.3 kmeans均值聚类 (1)

4.3 kmeans均值聚类 (2)

4.1 盖帽法处理异常值
即分别设定数据的上下限,高于上限的用上限替换,低于下限的用下限替换

4.2 盖帽法处理异常值后重现考察数据的分布情况

R语言聚类分析之层次聚类(hierarchical clustering)实战

R语言聚类分析之层次聚类(hierarchical clustering)实战

目录

R语言聚类分析之层次聚类(hierarchical clustering)实战

#距离计算

以上是关于R语言之实战分析的主要内容,如果未能解决你的问题,请参考以下文章

《R语言实战》 之 R的使用

R语言聚类分析之基于划分的聚类KMeans实战:基于菌株数据

R语言系列之1------数据类型

R语言数据分析从入门到高级:数据清洗之日期型数据处理

R语言聚类分析之基于划分的聚类KMeans实战:基于葡萄酒数据

大数据之R语言速成与实战,送给数据分析爱好者