R语言实战——2.2基本统计分析

Posted 零基础学数据分析

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言实战——2.2基本统计分析相关的知识,希望对你有一定的参考价值。




基本统计分析

01

相关

相关的类型

Pearson spearman kendall

pearson衡量像个定量变量之间的线性相关程度spearman衡量分级定序变量之间的相关程度kendall是非参数的等级相关度量

Cor()函数

cor(x,use=method=)

可以计算上述三种相关系数,默认计算pearson相关系数

x为矩阵或数据框

use指定缺失值的处理方式:all.obs遇到缺失值时将报错;everything遇到缺失值时其结果将被设为missing;complete,obs删除缺失行;pairwise.complete.obs成对删除

cor(x,y)

计算一组变量与另一组变量的相关系数


cov()函数可以用来计算协方差

偏相关

指控制一个或多个变量,另外两个定量变量之间的相互关系

可以使用ggm包中的pcor()函数计算偏相关系数pcor(u,s)

示例:

library(ggm)

colnames<-(states)

pcor(c(1,5,2,3,4,6), cov(states))

u为数值向量,前两个数值即表示要计算相关系数的两个变量的位置,其余数值表示控制变量的位置

相关性的显著性检验

cor.test()对相关系数进行检验

cor.test(x, y, alternative= , method= )

alternative用于指定进行双侧检验还是单侧检验,two.side(默认)双侧检验,less当总体的相关系数小于0时,greater当总体的相关系数大于0时

method用于选择哪一类相关系数,pearsonspearmankendall

其检验的原假设为:两个变量间相互独立

cor.test()一次只能检验一种相关关系

psych包中的corr.test()可以一次检验多个相关关系

偏相关系数检验

psych包中的pcor.test()可用于检验控制一个或多个变量时两个变量之间的条件独立性pcor.test(r,q,n)

r为偏相关系数,q为要控制的变量的位置,n为样本大小

02

t检验

独立样本的t检验

一个针对两组的独立样本t检验可以用于检验两个总体的均值相等的假设

t.test(y~x,data=) 

y为数值型变量,x为二分变量

t.test(y1~y2)

y1 y2分别为各组的结果变量,为数值型变量

该t检验默认假定方差不相等并使用Welsh的修正自由度

可以添加函数var.equal=TRUE假定方差相等并使用合并方差估计

非独立样本的t检验

t.test(y1,y2,paired=TRUE)

03

组间差异的非参数检验

定义

若数据无法满足t检验或ANOVA的参数检验条件可以使用非参数方法(假设不合理时)

R语言实战——2.2基本统计分析(二)

两组比较

数据独立

使用Wilcoxon秩和检验,wilcoxon.test(y~x,data=)  Wilcoxon.test(y1,y2)


数据非独立

使用Wilcoxon符号秩检验,wilcoxon.test(y~x,data=,paired=TRUE)  Wilcoxon.test(y1,y2,paired=TRUE)

多于两组的比较

数据独立

使用Kruskal-Wallis检验

kruskal.test(y ~ A,data=)

y为数值型结果变量,A为拥有两个或更多水平的分组变量


数据非独立

使用Friedman检验

friedman.test(y ~ A|B,data=)

A为分组变量,B为用以认定匹配观测的区组变量

我知道你在看


以上是关于R语言实战——2.2基本统计分析的主要内容,如果未能解决你的问题,请参考以下文章

R语言实战-云图

R语言实战 - 基本统计分析- 描述性统计分析

R语言实战应用-基于R语言的对应分析

R语言KNN模型数据分类实战

R语言实战 第九章 方差分析

R语言应用实战-基于R语言的典型相关分析