计算相关性系数

Posted djx571

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了计算相关性系数相关的知识,希望对你有一定的参考价值。

转自:http://www.omicshare.com/forum/thread-741-1-1.html

范例文件(txt)是一个20个样本,30个基因的表达量表格矩阵。每一行是1个基因,每一列对应1个样本。
技术分享图片
这是一个典型的数据框文件。现在我要计算两两样本间的表达量的相关系数,并且对相关系数的结果绘制热图,该怎么做呢?只要两步:
(1)计算相关系数;
在R语言里面,相关系数的命令是 cor。这个命令是可以计算两个向量的相关系数。但你如果输入数据是数据框的,而且cor命令自动计算所有列(向量)的两两相关系数(范例文件列方向正好是样本)。
(2)绘制热图
绘制热图可以使用pheatmap这个命令。


代码如下:
############
library(pheatmap)   #加载pheatmap 包;
data=read.table("exp_top30.original.txt",header=T,row.names=1,sep=" ")
matrix=cor(data)   #计算相关系数;
write.table(matrix,"coefficient_matrix.txt",sep=" ")             #将相关系数计算结果输出存储到你的电脑里,存储为1个txt文件;
pheatmap(matrix,cluster_rows=F,cluster_cols=F,display_numbers=T) # 行和列都不聚类,并且在热图中显示数值;
#####################

效果图:
技术分享图片

如果要计算每一行的相关系数(这里行方向是基因,即行间相关系数就是基因间的相关系数),则需要对矩阵做个转置,即行列对调,使用t()命令即可,
代码如下:
###################
library(pheatmap)   #加载pheatmap 包;
data=read.table("exp_top30.original.txt",header=T,row.names=1,sep=" ")
data=t(data)  # 对数据做转置;
matrix=cor(data)   #计算相关系数;
write.table(matrix,"coefficient_matrix.txt",sep=" ")            #将相关系数计算结果输出存储到你的电脑里,存储为1个txt文件;
pheatmap(matrix,cluster_rows=F,cluster_cols=F,display_numbers=T,fontsize_number=4,number_format = "%.2f") # 注意,由于格子比较多,所以用fontsize_number定义了格子中数字的字体大小, number_format 可以控制有效小数的位数,这里是保留两位小数;
#################################

效果图如下:
技术分享图片






































以上是关于计算相关性系数的主要内容,如果未能解决你的问题,请参考以下文章

相关系数r的计算公式是啥?

相关系数r的计算公式是啥?

如何用matlab计算皮尔逊相关系数

计算相关性系数

R语言,分别计算pearson和spearman相关系数

怎么用spss计算两个变量间的相关系数