lncRNA简介&链特异性

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了lncRNA简介&链特异性相关的知识,希望对你有一定的参考价值。

参考技术A lncRNA,全称“长链非编码RNA”(long non-coding RNA),是近年来RNA方向的研究热门。

以前只是各种听说,没正儿八经地做过lncRNA的测序分析。最近接到新任务,所以来了解了解,本人实在健忘,所以记下lncRNA的基础信息。

1)长度在200-100000nt之间的RNA分子;

2)具有mRNA样结构,有polyA尾巴和启动子样结构;​

3)不编码蛋白。

在生信分析中,往往会去除

熟悉lncRNA测序的朋友们肯定知道,lncRNA测序多采用链特异性建库。其原因为:

1)lncRNA的来源是具有链特异性的;

2)lncRNA来源就是编码蛋白(mRNA)​基因的反义链,是传说中的天然反义lncRNA(NAT-antisense lncRNA);如果是普通非链特异性建库,那么序列是来自mRNA,还是NAT-antisence LncRNA就难以区分了;

3)​链特异性建库可更准确地统计转录本的数量和确定基因的结构,准确区分获得的转录本来自基因组哪条链。​

一站式 lncRNA 查询数据库


点击蓝字





写在前面

在研究一个lncRNA之前,我们都要先去查看这个lncRNA可能的相关功能,比如要查看这个lncRNA的表达、查看其相互作用的miRNA或者需要去查看调控这个lncRNA的转录因子。对于不同的需求需要使用不同的数据库,今天就来介绍一个一站式查询lncRNA相关功能的数据库: AnnoLnc2 (http://annolnc.gao-lab.org/)


一站式 lncRNA 查询数据库


这个数据库可以查询多个对于lncRNA多个方面的结果,,一般这种汇总式的数据库,类似于一个中间站,是汇总了很多数据库的结果,所以我们就来介绍了一下数据库都有什么结果以及数据库的结果是基于什么做出来的。






PART 1

数据库使用


首先需要注意的是,这个数据库可以对人和老鼠的lncRNA进行注释。这个数据库没有使用基因名数据的方式来进行查询,而是使用了输入Fasta序列的方式来进行查询的。我们需要做的就是选择物种、输入序列、提交结果。


一站式 lncRNA 查询数据库


在结果界面,首先能看到一个在左侧侧边栏有一个主要的结果,这个是数据库对于一个lncRNA所有相关的注释的条目,我们可以点击某一个标题就可以直接跳转到这个地方了。






PART 2

结果汇总


首先我们看到的是一个对于检索的lncRNA的一个结果的基本汇总,可以在汇总当中了解关于这个lncRNA的基因主要显著的信息。


一站式 lncRNA 查询数据库






PART 3

基因组位置及结构


在基因组位置这里,数据库把我们提交的序列和目前已知的基因组序列进行比对,来查看这个序列具体的位置以及相关的特征。另外,关于序列特征当中,有一个重复序列的预测,这个作者使用的是 RepeatMasker 来预测的序列当中是否有重复序列。


一站式 lncRNA 查询数据库


关于lncRNA本身的二级结构,这个数据库也进行了预测,具体的预测是通过ViennaRNA (http://rna.tbi.univie.ac.at/) 数据库,这个数据库是专门用来预测RNA二级结构的,如果有其他二级结构预测的基因,可以去看一下。


一站式 lncRNA 查询数据库





PART 4

表达和调


了解了lncRNA的序列特征之后,就要看这个lncRNA表的情况以及其相关的调控情况了。

1 表达情况

关于基因的表达情况,数据库使用了GETx数据库里面的正常组织、CCLE里面的癌症细胞系以及ENCODE数据库里面的数据来进行查看的,在结果呈现当中,也是分成了正常组织和癌症组织分类来查看的。


一站式 lncRNA 查询数据库


2 亚细胞定位

对于lncRNA表达的不同位置可能形式不同的功能。之前我们介绍过关于lncRNA亚细胞定位的数据库,具体的可以参考第二条推送。这个数据库也提供了相关的预测功能,具体的是使用了十种人类细胞胞质和胞核的表达测序的数据,通过比较核/胞质表达来确定这个lncRNA主要是在哪个地方表达。另外的也有包括说多基序(motif)也是可以帮助lncRNA定位的,所以这个数据库就收集了和亚细胞定位的motif来进行预测。


一站式 lncRNA 查询数据库


3 表达调控

在表达调控方面,最经典的还是转录因子调控以及miRNA调控。这个数据库使用GTRD来预测lncRNA的可能收到的转录因子调控作用,同时使用TargetScan来预测其miRNA调控的作用。


一站式 lncRNA 查询数据库
4 SNP调控

基因序列的改变也会影响这个基因的调控的,所以这个数据库通过GWAS数据库来寻找影响这个lncRNA的SNP,进一步的通过eQTL来评价哪些SNP对于这个lncRNA的表达有影响,这个分析的主要数据来自于GETx。

一站式 lncRNA 查询数据库





PART 5

相互作用与功能


1 与mRNA表达的相关性

由于使用的RNA-seq的数据,所以就可以看lncRNA的表达和哪些基因存在共表达关系,所以这个数据库提供了正常组织和癌症细胞当中共表达的基因。


一站式 lncRNA 查询数据库


2 与蛋白的相互作用

看完了mRNA的共表达,就可以看这个和蛋白的关系了。这个数据库使用了目前发表的GEO上面的CLIP-seq的数据来进行分析,对于GEO里面没有的蛋白数据,数据库使用lncPro数据库来进行预测。所以在结果当中就包括两个部分,一个是lncPro数据库的结果,另外一个则是CLIP-seq分析的结果。

一站式 lncRNA 查询数据库


3 功能预测

了解了lncRNA的相互作用的基因了,就可以来预测这个lncRNA的功能了。由于lncRNA本身是不会编码蛋白来发挥作用的,所以主要是通过其相互作用的基因来预测这个lncRNA的功能,这个数据库主要预测了lncRNA本身GO分析的功能。


一站式 lncRNA 查询数据库






PART 6

进化分析


最后对于基因的序列,不同的物种可能序列长度是不一样的,所以可以来进行物种之间的进化分析,来了解不同物种之间同一个lncRNA的进行情况。这个数据库主要是通过UCSC来下载相关的序列,然后通过phyloFit来比较物种之间的进化关系。




PART 7

数据库总结


如果我们要了解一个lncRNA的基本信息的话,基本上这个数据库做的已经很详细了,所以如果刚刚拿到手一个lncRNA可以通过这个数据库来看一下其基本的功能,然后看怎么来进行研究。


以上是关于lncRNA简介&链特异性的主要内容,如果未能解决你的问题,请参考以下文章

如何运用KEGG数据库查询信号通路(升级版)

⚡每日肥学⚡——Deque简介&删除链表的倒数第 N 个结点

深度好文 单细胞RNA测序技术简介

地理探测器简介(R语言)

AI&BlockChain:“知名博主独家讲授”人工智能创新应用竞赛精选实战作品之《基于计算机视觉自然语言处理和区块链技术的乘客智能报警系统》案例的界面简介功能介绍分享之自然语言处理技术

技能——如何判断测序数据是不是是链特异性