R语言进行相关性分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言进行相关性分析相关的知识,希望对你有一定的参考价值。

参考技术A

相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性分析旨在研究两个或两个以上随机变量之间相互依存关系的方向和密切程度。
一般来讲研究对象(样品或处理组)之间使用距离分析,而元素(物种或环境因子)之间进行相关性分析 。两个变量之间的相关性可以用简单相关系数(例如皮尔森相关系数等)进行表示,相关系数越接近1,两个元素相关性越大,相关系数越接近0,两个元素越独立。

Pearson相关系数是用于表示相关性大小的最常用指标,数值介于-1~1之间,越接近0相关性越低,越接近-1或1相关性越高。正负号表明相关方向,正号为正相关、负号为负相关。适用于两个正态分布的连续变量。

利用两变量的秩次大小来进行分析,属于非参数统计方法。适用于不满足Pearson相关系数正态分布要求的连续变量。也可以用于有序分类变量的之间的相关性测量。

Kendall\'s Tau相关系数是一种非参数检验,适用于两个有序分类变量。

此外衡量两个变量之间关系的方法还有:卡方检验、Fisher精确检验等。

Pearson、Spearman、Kendall相关系数都可以通过cor函数实现,cov协方差函数参数同cor函数。

ggcorrplot包内只有2个函数,一个cor_pmat()用于计算p值,一个ggcorrplot()用于绘图。ggcorrplot相当于精简版的corrplot包,只有主题更加丰富多样。

This function computes and returns the distance matrix computed by using the specified distance measure to compute the distances between the rows of a data matrix.
这个函数用特定的方法计算矩阵的行之间的距离,并返回距离矩阵。

scale是对矩阵的每一列进行标准化,如果要对行标准化需要先转置。如 heatmapdata <- t(scale(t(heatmapdata)))

R语言进行微生物环境因子相关性分析




01

相关分析概述

1.1 线性相关分析

(1) 基于相关系数的相关分析(Pearson相关,秩相关) 。

(2) 基于模型的相关分析

     ✳线性回归分析( Pearson相关是线性回归的一种特殊情况)

     ✳偏相关 

     ✳基于线性模型和降维手段的RDA分析 

1.2 非线性相关分析

大多基于模型,logit回归模型,生存分析模型,基于峰值模型和降维手段的CCA等。

1.3 常见的相关系数

(1)Pearson相关:更适合分析两个服从正态分布的变量的相关。

(2)秩相关:如Spearman秩相关、kendal秩相关。它们只考虑排序的相关程度,不考虑具体的值,应用相对广泛,且不要求正态分布。

1.4 相关系数的可视化

(1)相关网络:用有无线条、线条粗细、线条颜色等体现相关系数和显著性。

(2)相关性热图:用颜色深浅,符号等体现相关系数和显著性。