16s 数据库
Posted hisak
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了16s 数据库相关的知识,希望对你有一定的参考价值。
一、Greengenes数据库
Greengenes数据库由Lawrence Berkeley National Laboratory构建。最新版本为13.8,它对13.5的序列分类进行了修正,13.5版本总共收录16S rRNA序列1,262,986条。这是非冗余的序列,Greengenes可以用Export工具实现对数据的过滤,输出定制的数据库。qiime软件中默认使用的是greengene数据库,为97_otus.fasta这个文件,以及一个对应的注释文件97_otu_taxonomy.txt,一个构建好的系统发育树97_otus.tree。里面包含了99322条非冗余的16S序列。目前最新的文件为99_otus.fasta。Greengenes提供比对工具NAST,可进行多序列比对。提供在线trim处理,可以根据质量值修剪FASTA格式数据文件。qiime中可以使用pynast软件来进行比对,此外,网站的probe工具提供16S rRNA区域探针或者引物的设计功能。GreenGene只包含16S/18S序列,不包含大亚基23S/28S序列。
网站链接:http://greengenes.secondgenome.com/
http://greengenes.secondgenome.com/downloads/database/13_5
二、SILVA数据库
SILVA数据库由德国马普研究所和Ribocon主持,提供最新的核糖体大小亚基rRNA注释信息。SILVA数据库是软件包ARB的官方数据库,提供全面的,高质量的可比对的小亚基(如16S/18S,SSU),以及大亚基(23S/28S,LSU)的rRNA序列,用于细菌,古生菌,以及真菌分析。silva也是mothur软件中推荐使用的数据库,截止到本课程制作时间的版本是Version 126,不过126版本目前只提供网络应用,能够下载使用的为123版本。silva数据库提供超过170多万个SSU,9万多LSU序列。silva数据库里面包含五个独立的部分,分别是小亚基的SSU Parc,SSU Ref 以及 SSU Ref NR ,还有大亚基的LSU Parc 与LSU Ref。这些库之间有什么差别呢。这是根据不同的序列长度以及聚类的序列相似性来生成的。官网上面有详细的介绍。我们可以通过网页或者ftp服务器下载silva的数据库。里面包括arb文件和fasta文件,如果不使用arb的软件,我们只需下载fasta的文件。ARB_files存储的为arb格式的文件,Export为fasta序列格式的文件。在16S序列分析中,我们推荐使用SSU Ref NR这个数据库,这个是使用99%的identity标准来进行非冗余处理,准确性更高,在18S序列分析中,使用LSU Ref。并且这些版本的数据库包含一个Guide Tree。
三、RDP数据库
RDP数据库来自于(Ribosomal Database Project),前面课程我们提到过RDP的分析流程。其中数据库提供核糖体相关数据和服务,包括在线的数据分析、比对、16S rRNA序列的注释。RDP最新版本是Release 11.4,发布于2015.5.26,收录了共3,224,600条16S rRNAs序列,108,901条真菌28S rRNA序列,是使用最广的16S rRNA序列数据库。RDP数据库提供16S rRNA序列比对和分类、进化树构建、物种分类heatmap、功能基因分析等方便的数据处理功能。RDP项目提供了完整的16S和18S分析方案,
网站链接:http://rdp.cme.msu.edu/index.jsp
以上是关于16s 数据库的主要内容,如果未能解决你的问题,请参考以下文章
MicFunPred——最新16S rRNA扩增子数据功能预测数据库
16s rRNA的本质是RNA,为啥GENBANK里面的序列组成却是ATCG?