使用RSEM进行转录组测序的差异表达分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用RSEM进行转录组测序的差异表达分析相关的知识,希望对你有一定的参考价值。

参考技术A 如果用RSEM对比对后的bam进行转录本定量,则在比对过程中要确保比对用到的索引是由rsem-prepare-reference产生的。

可以看到,单纯用bowtie2建的索引和rsem调用bowtie2建的索引是不一样的。

用法分为两类,分别是从fa/fq得到表达矩阵,和从sam/bam得到表达矩阵(仍然要求是比对到rsem-prepare-reference生成的索引)。以单端的fq数据为例。

完成之后得到这些文件,其中,rsem.genes.results和rsem.isoforms.results分别表示gene水平和转录本水平的定量结果。每一列含义:

后面用EBseq检验差异基因/转录本时,会使用到这两个文件。

下面以gene水平差异分析为例。

这一步提取上一步得到的每个样本定量结果文件中的expected_count列,组成数据矩阵。

调用EBseq进行检验

控制FDR(错误发现率)来挑选差异基因

将GeneMat.results文件中,PPDE大于0.95的记录提取出来

转录组分析中—用R语言画带基因名标签的PCA主成分分析图

参考技术A

 

 

1. “PCA.data.txt” 为基因表达值矩阵。其中第一列为基因名称,这里以ensembl id作为指代;其余各列记录了RNA-seq获得的各基因在各样本中的表达量信息。

2. “group.txt” 则为样本分组文件,记录了样本所属的不同分组。

以上是关于使用RSEM进行转录组测序的差异表达分析的主要内容,如果未能解决你的问题,请参考以下文章

怎么分析关注的功能基因集在转录组结果中表现如何?

转录组测序3-序列基因组比对

转录组分析的正确姿势

转录组测序1-测序原始数据说明

简单的转录组差异基因表达分析 -- DESeq2

单细胞转录组测序知识一隅