什么是基因结构注释

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么是基因结构注释相关的知识,希望对你有一定的参考价值。

属于生物信息学范围名词,即以基因的结构作为客观依据,通常通过对其结构的改变观察相关基因的功能、性质的变化,来对于此基因结构所对应的功能予以联系。简而言之,便是通过研究基因的结构与其功能的关系,以求得通过观察基因结构便能预推出其功能的研究方法与思路。

近来的研究表明,基因组不仅是基因的简单排列,它有其特有的组织结构和信息结构,这种结构是在长期的演化过程中产生的,也是基因发挥其功能所必须的。弄清楚生物体基因组特有的组织结构和信息结构,解译生命的遗传语言的关键。

其作用有:
生物大分子结构模拟和药物设计
包括RNA(核糖核酸)的结构模拟和反义RNA的分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于DNA结构的药物设计等。

参考资料:http://www1.glmc.edu.cn/genome/index9.asp

参考技术A 基因结构预测

跟着Cell学单细胞转录组分析(五):单细胞转录组marker基因鉴定及细胞群注释

参考技术A 书接上回( 跟着Cell学单细胞转录组分析(四):单细胞转录组测序UMAP降维聚类 )。完成数据降维和细胞聚类后,最主要的环节和工作就是确定各个细胞群,明确是什么类型的细胞,正群的细胞定群很关键,涉及到整个研究,所以这一步宁愿多费时间,也不要出错。当然,这也不是一蹴而就的,需要反复的确认。

要确定各个群是什么细胞,首先需要了解细胞群的marker基因,因为不同类型的细胞突出 表达的基因也是不同的。这里使用FindAllMarkers鉴定各个细胞群的高表达基因。

Seurat提供了几种函数例如FeaturePlot()、DotPlot()和DoHeatmap(),按照文章中的mrker基因,做一下可视化。

点图:

UMAP图:

热图:

很显然,这些都是默认出图,距离发文章还是有一定距离的,后期我们会专门讲解个性化的修饰,争取可视化更好。

接下来就是细胞定群了,对各个细胞群命名。细胞定群有很多方法,目前也有很多工具,但是依照我的经验,自动定群等一般结果不是完全正确,况且操作复杂,为了保证正确性,最使用的办法还是查询文献定群。定群后,对细胞群重命名。

最后将命名的文件保存,可视化细胞群!在进行下一步工作之前,之后的内容将会是对目前这些图形结果的修饰和个性化可视化!

以上是关于什么是基因结构注释的主要内容,如果未能解决你的问题,请参考以下文章

什么是基因注释?

基因组序列注释 (基因结构预测)

转录组入门:了解参考基因组及基因注释

4️⃣ 核酸序列特征分析(8):重复序列的查找

Augustus 进行基因注释

Augustus 进行基因注释