转录组分析——STAR+RSEM+Deseq2

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了转录组分析——STAR+RSEM+Deseq2相关的知识,希望对你有一定的参考价值。

参考技术A

B站上有大量生信干货, 学生信看B站足以 , 别问我B站是什么哈 ;
生信技能树论坛( http://www.biotrainee.com )

2个样品2个重复(2*2)
1_1
1_2
2_1
2_2

SAM flags查询(sam格式文件)

FastQC Multiqc Trimmomatic STAR RSEM Subread HTSeq kallisto Deseq2 ...(conda可以安装)

横坐标代表每个每个碱基的位置,反映了读长信息,比如测序的读长为150bp,横坐标就是1到150;
纵坐标代表碱基质量值,
图中的箱线图代表在每个位置上所有碱基的质量值分布,
中间的红线代表的是中位数
用黄色填充的区域的上下两端分别代表上四分位数和下四分位数;
箱线图最上方的短线代表90%,最下方的短线代表10%
蓝色的线代表平均值
背景色从上到在下依次为green, orange, red; 分别代表very good, reasonable, poor;将碱基质量分成3个不同的标准
当有一个位置的10%四分位数小于10或者中位数小于25时会给出警告;
当有一个位置的10%四分位数小于5或者中位数小于20时会提示失败;
如下图所示:

从上面图中我们可以看出读长为75bp;前15bp左右测序质量非常好;
随着测序的进行,由于试剂的消耗等原因,测序质量开始逐渐降低,最后的60-75bp质量就非常的差;

测试rsem是否安装

kallisto 不比对,直接定量

install.packages("ggrepel")
install.packages("ggplot2")

limma、DESeq2、edgeR差异分析及绘制韦恩图

参考技术A

不同的时空以及不同的条件下差异基因分析是RNAseq分析的重要目标。
差异表达分析方法包括:
基于Read数目: DESeq、limma和edgeR;
基于组装技术: Cuffdif和Ballgown;
基于免比对的定量方法(kallisto、Salmon、Salfish): sleuth。

用的是rsem的count文件

以上是关于转录组分析——STAR+RSEM+Deseq2的主要内容,如果未能解决你的问题,请参考以下文章

简单的转录组差异基因表达分析 -- DESeq2

转录组差异分析流程三大R包比较

转录组数据标准化--Normalization

转录组入门(7):差异表达分析

DEseq2差异表达分析

转录组定量工具-featureCounts安装及使用