标准化之CPM/RPKM/FPKM/TPM

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了标准化之CPM/RPKM/FPKM/TPM相关的知识,希望对你有一定的参考价值。

参考技术A

- 差异分析 时,需考虑实验设计(样本组成)和测序原理向(测序深度、基因长度、RNA 组成)
- 转录组下游分析 时,采用DESeq2、edgeR和limma,需要的输入数据类型是counts(正整数)

-RPKM:以每个Read为一个单位,单端测序常用
-FPKM:以Fragment一个单位,主要在双端测序
(这两个很相似,都是先标准化测序深度,再标准化基因长度)

-目前推荐使用TPM
(TPM先标准化基因长度,再标准化测序深度)
【标准化后每个样本的total TPM是相同的,可以更易看出what proportion of reads mapped to what in each sample;此外,RNA-seq数据是用于比较reads的相对量,因此,TPM更为合理】

- 为什么在进行分析时需要对FPKM进行log2转化
因为原始FPKM是偏态分布的,log2转化后使数据呈 正态分布 (正态分布是大部分统计学分析方法需要的数据类型)

以上是关于标准化之CPM/RPKM/FPKM/TPM的主要内容,如果未能解决你的问题,请参考以下文章

转录组表达定量- Read count?CPM? RPKM? FPKM?

RNA-seq中的那些统计学问题(二)FPKM/RPKM之外的那些标准化方法

Read count、CPM、 RPKM、FPKM和TPM的区别

【点】count、RPM、RPKM、FPKM、TPM

RNA_Seq分析中的标准化(reads_count,FPKM, RPKM, TPM)

RPKM, FPKM 和 TPM