使用RSEM进行转录组测序的差异表达分析
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用RSEM进行转录组测序的差异表达分析相关的知识,希望对你有一定的参考价值。
参考技术A 如果用RSEM对比对后的bam进行转录本定量,则在比对过程中要确保比对用到的索引是由rsem-prepare-reference产生的。可以看到,单纯用bowtie2建的索引和rsem调用bowtie2建的索引是不一样的。
用法分为两类,分别是从fa/fq得到表达矩阵,和从sam/bam得到表达矩阵(仍然要求是比对到rsem-prepare-reference生成的索引)。以单端的fq数据为例。
完成之后得到这些文件,其中,rsem.genes.results和rsem.isoforms.results分别表示gene水平和转录本水平的定量结果。每一列含义:
后面用EBseq检验差异基因/转录本时,会使用到这两个文件。
下面以gene水平差异分析为例。
这一步提取上一步得到的每个样本定量结果文件中的expected_count列,组成数据矩阵。
调用EBseq进行检验
控制FDR(错误发现率)来挑选差异基因
将GeneMat.results文件中,PPDE大于0.95的记录提取出来
转录组分析中—用R语言画带基因名标签的PCA主成分分析图
参考技术A
1. “PCA.data.txt” 为基因表达值矩阵。其中第一列为基因名称,这里以ensembl id作为指代;其余各列记录了RNA-seq获得的各基因在各样本中的表达量信息。
2. “group.txt” 则为样本分组文件,记录了样本所属的不同分组。
以上是关于使用RSEM进行转录组测序的差异表达分析的主要内容,如果未能解决你的问题,请参考以下文章