salmon分析RNA-seq实战

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了salmon分析RNA-seq实战相关的知识,希望对你有一定的参考价值。

参考技术A

查看帮助文档

目前,Salmon有两种不同的方法---支持将reads比对到transcriptomes,分别是(SMEM-based) lightweight-alignment 和 quasi-mapping。SMEM-based mapping是Salmon自带的轻量级的比对方法;而 quasi-mapping这种比对方法相对较新较快。这两种方法的使用均是通过 quant 命令来应用的,但是两者比对方法所应用到的索引不同。

quasi-mapping 应用到的数据结构是:a combination of data structures—a hash table, suffix array (SA) and efficient rank data structure

quasi-mappings的详情见: RapMap: a rapid, sensitive and accurate tool for mapping RNA-seq reads to transcriptomes

Quantification File: quant.sf
quant.sf 文件有5列,分别是Name,Length ,EffectiveLength,TPM和NumReads。分别表示的含义如下所述:

补充: FPKM,RPKM,RPM以及TPM的关系之见解
RPKM (Reads Per Kilobase Million)
FPKM (Fragments Per Kilobase Million)
TPM(Transcripts Per Kilobase Million)
RPM (Reads per million)
CPM (Counts per million)

TPM :
Transcripts Per Kilobase of exonmodel per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts),优化的RPKM计算方法,可以用于同一物种不同组织的比较。
TPM概括了基因的长度、表达量和基因数目。TPM可以用于同一物种不同组织间的比较,因为sum值总是唯一的。

cmd_info.json : JSON格式文件,记录salmon程序运行的命令和参数
lib_format_counts.json : Observed library format counts。当运行salmon是 mapping-based mode 时,则会生成改文件。 JSON格式文件,记录有关文库格式和reads比对的情况。
eq_classes.txt : Equivalence class file。当Salmon运行时,应用参数 --dumpEq ,则会生成此文件。
aux_info : 辅助文件夹,内含多个文件
fld.gz :在辅助文件夹中,该文件记录的是观察到的片段长度分布的近似值
obs5_seq.gz, obs3_seq.gz, exp5_seq.gz, exp5_seq.gz : Sequence-specific bias files
expected_gc.gz, observed_gc.gz : 当Salmon运行时,应用fragment-GC bias correction,在辅助文件夹中则会生成这两个文件。记录Fragment-GC bias。
meta_info.json : JSON格式文件,记录salmon程序运行的统计信息
ambig_info.tsv : tab分隔符的文本文件,含有两列。记录的是每个转录本对应的 the number of uniquely-mapping reads 和 the total number of ambiguously-mapping reads

参考: Salmon---a tool for wicked-fast transcript quantification from RNA-seq data

以上是关于salmon分析RNA-seq实战的主要内容,如果未能解决你的问题,请参考以下文章

STEP4: 得到表达矩阵的流程

RNA-seq分析软件“海底捞“--RNACocktail

无生物学重复RNA-seq分析 CORNAS: coverage-dependent RNA-Seq analysis of gene expression data without biologi

RNA-seq分析

RNA-seq中的基因表达量计算和表达差异分析

RNA-Seq分析|RPKM, FPKM, TPM, 计算对比