转录组差异分析流程三大R包比较

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了转录组差异分析流程三大R包比较相关的知识,希望对你有一定的参考价值。

参考技术A 总目录:

edgeR: 原始的count矩阵,支持单个样品和重复样品
DESeq2: 原始的count矩阵(htseq-count),只支持重复样品
limma: 原始的count矩阵(需自己标准化,一定要log化)、经过标准化的矩阵或芯片数据,只支持重复样品
注: 无重复RNAseq样本推荐使用Gfold软件进行分析

导入数据

差异基因数目比较

edgeR: 得到基因数目最多

DESeq2: 得到基因数目适中

limma: 得到基因数目最少

差异基因一致性比较

结论:

三个R包得到的差异基因数目差别不是很大
edgeR包和DEseq2包得到的差异基因更加相似
limma包得到的差异基因准确率最高(其他两个R包不能得到的差异基因数量最少,只占总数的2%),但假阴性高(实际差异结果不差异)
edgeR包能得到更多的差异基因,但假阳性高(实际不差异结果差异)
运行速度比较
计算从导入数据(16610基因,8样本)到差异分析结束所需要的时间
limma: 3.944069 secs
edgeR: 5.882637 secs
DEseq2: 10.55145 secs
由此可见limma分析速度最快,DEseq2分析速度最慢

————————————————

原文链接: https://blog.csdn.net/weixin_45161743/article/details/103536523

以上是关于转录组差异分析流程三大R包比较的主要内容,如果未能解决你的问题,请参考以下文章

转录组分析的正确姿势

R语言GEO数据挖掘:步骤三:进行基因差异分析

使用RSEM进行转录组测序的差异表达分析

DEseq2差异表达分析

转录组分析中—用R语言画带基因名标签的PCA主成分分析图

单细胞转录组测序分析--初探Seurat