每周文献马铃薯泛基因组揭示进化历史
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了每周文献马铃薯泛基因组揭示进化历史相关的知识,希望对你有一定的参考价值。
参考技术A马铃薯是全球性的重要作物,目前商业种植主要采用的是同源四倍体马铃薯块茎,运输和种植都多有不便。因此如果能使用二倍体马铃薯种子种植将会降低种植成本,便于马铃薯育种。但目前马铃薯基因组进化和物种多样性的研究十分有限。而本文填补了马铃薯泛基因组进化的空白并为马铃薯基因组设计育种提供了新的见解。
作者基于432个马铃薯株系建立起的系统发育树中选取了44个代表性株系,对其进行了Pacbio HiFi测序。并且在这44个株系中又选择了7个株系进行Hi-C测序并组成完整的基因组。
接下来为了构建马铃薯全基因库,作者利用44株马铃薯代表性物种+现有的一个马铃薯参考基因组 S. tuberosum Group Phureja 构建了泛基因组。通过聚类预测基因模型作者发现当马铃薯物种数在40左右的时候, 泛基因组规模(聚类预测基因数量)增大到了一个瓶颈。说明此时泛基因组已经能够反映物种的核心基因情况 。因此作者根据基因簇出现频率将其划分成四类:核心基因(core clusters ,存在于所有45份材料中)、次核心基因(soft-core clusters,存在于42-44份材料中)、边缘基因(shell clusters,存在于2-41个个体中)和特异性基因(accession-specific clusters)。这些泛基因组资源为利用马铃薯生物学和育种中的全段基因库提供了一个起点。
由于马铃薯家族遗传多样性和发育关系还未曾阐明,作者利用三代测序Pacbio从头测序了两个马铃薯的祖先种 Etuberosum ( Solanum etuberosum 和 Solanum palustre )并构建了系统发育树(Fig1a)。
结果非常Amazing!系统发育树关系显示(Fig1a)两个马铃薯的祖先种 Etuberosum ( 橙色块位置)与马铃薯家族的关系要比三个“外群”种 Lycopersicon (绿色快位置)更近, 这和刚刚的假设产生了矛盾 。此外作者分别使用单拷贝基因簇建树以及基因组随机滑窗建树,发现二者大致一致,但也存在相当数量的分歧。 这两点都说明了马铃薯家族进化关系相当复杂,在这里作者推断可能是发生了种间基因渗入 。因此采用了D统计和f4统计检测基因流及基因流动比例。D统计结果显示马铃薯家族 Petota 及其祖先Etuberosum存在明显的基因流动(fig1c),马铃薯基因组上8.4%的基因是由Etuberosum流入的。 种间基因流一定程度上解释了马铃薯家族系统发育的混乱。
采用无性繁殖获得的马铃薯容易感染块茎疾病,但实际上马铃薯可能通过扩张抗性基因库抵抗这些疾病。马铃薯的免疫系统进化值得深入研究。 在这里作者开发了新的NLR基因注释方法,其结合NLR-annotator和MAKER2两款软件,前者实现NLR基因的初步预测,后者能够根据现有Renseq数据,采用机器学习方法从头预测NLR基因并进行基因组注释 。最终二者取并集即为NLR基因重注释的结果。以此法作者注释了上述45个马铃薯家族成员一共 57,683个NLR基因。并且发现不同马铃薯种间NLR基因拷贝数差异巨大(Fig2ab)。
与祖先种 Etuberosum (ETB)和番茄基因组相比,马铃薯基因组中含有的NLR基因有了很大程度的扩张。作者将这些NLR基因分成了424个簇,其中161个簇呈现出扩张的迹象。这里面就包含了著名的 马铃薯抗性基因R3a (Fig2c)。
马铃薯块茎储存了大量的营养物质,有助于马铃薯的存活。前人为数不多的研究发现,马铃薯结块基因受到顺式作用元件(cis-regulatory elements,CREs)的调控,而后者在进化上存在规律。顺式作用元件通常以非编码的保守序列(conserved non-coding sequences,CNS)出现,作者因此根据45个马铃薯株系基因组保守性得分计算出149,663个马铃薯特异性CNS。其中54.4%CNS存在于内含子位置,可能对结薯产生潜在影响。
为了进一步定位结薯相关基因,作者在块茎中检测到732种表达的基因,在这之中229个基因关联于马铃薯特异性CNS且在45个马铃薯株系中保持了保守性(Fig3a)。前任的研究显示TCP基因家族参与分生组织的发育,而这些基因中仅一个基因(Soltu.DM.06G025210)属于TCP家族。关联于此基因的CNS位于启动子上游376bp和157bp(Fig3b),可能调控此TCP的表达。 转录组分析进一步证明了Soltu.DM.06G025210表达于马铃薯的匍匐茎或块茎,而在远亲番茄中却测不到表达(Fig3c),符合番茄到马铃薯谱系的分化特点。
紧接着, 作者为了找到与IT1互作的基因,进行了酵母双杂实验 。筛选得到了SP6A(SELF-PRUNING 6A )基因,控制着薯块维管束运输信号(Fig3f)。SP6A可能与IT1形成复合体调控薯块形成。在马铃薯祖先(ETB)中也有一段SP6A的同源序列 SP6A etb ,但是该序列在ETB中却检测不到表达(Fig3c)。于是作者对IT1及其同源进行了结构分析,结果发现其PEBP域产生了缺失(Fig3g)。 SP6A结构域的缺失导致了马铃薯祖先ETB不能结薯。
高度纯合的自交系对于杂交育种至关重要。因此作者希望调查所研究株系的纯合度以备选可能的杂交材料。此外,由于倒置(inversions)会抑制重组,在杂交的时候会产生连锁阻力,从而阻碍育种。育种需要选择含有目的基因但又不含倒置片段的物种作为供体。因此作者利用20株马铃薯地方种和4株栽培种祖先(ETB)构建了大尺度倒置图谱(Fig4a)。在这之中作者发现与参考基因组相比(DM/PG5068)马铃薯祖先种(PG5068)三号染色体上有一段5.8Mb的基因倒置(Fig4b),与控制块茎胡萝卜素合成的Y位点(Y locus)连锁。二者难以发生重组,重组事件分布图(Fig4c)也证实了这一点: 该inversion所在位置重组事件发生率急剧降低。
说明 农业上如果选择具有黄色块茎肉(胡萝卜素合成多)的个体,可能会同时选择出该倒置,从而导致表型连锁阻力。 借助这里构建的泛基因组倒置图谱,育种家能选择合适的供体或受体株系进行回交。
新颖且内容极其丰富的泛基因组研究。作者从构建马铃薯泛基因组,讨论马铃薯家族和祖先种系统发育关系。从免疫基因扩库和结薯基因上详细研究了马铃薯家族的进化关系。其结薯基因IT1的鉴定方法能结合CNS关联让人耳目一新。生信层面之外作者还进行了基因功能验证,结合CRISPR技术呈现出极为明显的结薯表型,无论是基因鉴定手段还是基因功能本身,都具有学术和应用价值。 关键一作还是个博士生(不是博后或副研),博士的悲喜并不相同,我只觉得自己太菜。
文献阅读仅供参考,如有谬误欢迎各位大佬批评指正哈。
20200503文献速递
一
文献题目:Genome-wide DNA methylation profiles of low- and high-grade adenoma reveals potential biomarkers for early detection of colorectal carcinoma
不想看英文题目:全基因组DNA甲基化揭示了大肠癌早期检测的潜在生物标志物
杂志和影响因子:Clin Epigenetics (IF: 5.496)
样本量:20个control样本(从腺瘤患者组织中提取的正常组织),18个低度腺瘤,22个高度腺瘤,以及从GEO 数据库挖掘的278个正常样本,51个腺瘤样本和504个癌症样本。
分析方法:使用GenomeStudio处理甲基化原始数据,软件包pROC区分正常组织、LGA组织、HGA组织和CRC组织的高甲基化和低甲基化位点,使用R函数princomp进行PCA分析,使用KEGG和GO进行富集分析。
结论:研究发现,在低度腺瘤和高度腺瘤患者中,分别有209和8692个CpG 位点呈超甲基化,通路分析表明早期腺瘤甲基化变化主要与神经系统相关,ADHFE1启动子区域的DNA甲基化最有可能成为大肠腺瘤和大肠癌的早期诊断生物标志物。
数据GEO登录号:GSE139404
文章链接:https://www.ncbi.nlm.nih.gov/pubmed/32317010
二
文献题目:Genome-wide association meta-analyses combining multiple risk phenotypes provide insights into the genetic architecture of cutaneous melanoma susceptibility
不想看英文题目:结合多种表型和皮肤黑色素瘤的关联分析,鉴定皮肤黑色素瘤的易感基因以及影响皮肤黑色素瘤的风险表型
杂志和影响因子:Nat Genet (IF: 25.455)
样本量:36,760例case和375,188例control
分析方法:GWAS方法鉴定皮肤黑色素瘤的易感位点,条件和联合分析确定影响皮肤黑色素瘤的独立基因座,对痣的数量和头发颜色进行多基因风险评分分析(PRS),进一步探究痣的数量和头发颜色在皮肤黑素瘤患者的亚型方面有所不同,对皮肤黑色素瘤的显著信号与可能影响皮肤黑色素瘤的风险表型(端粒长度、晒黑反应、色素沉着和痣的数量)进行基因多效性分析,结合分区LD得分回归分析和GTEx数据确定皮肤黑色素瘤风险变异的目标组织,使用eQTL共定位分析确定涉及黑色素瘤的通路。
结论:确定了54个显着基因座,68个独立的SNP位点,急性黑色素瘤亚型与皮肤色素沉着无关,结合痣的数量、头发颜色、转录物组关联研究和黑色素瘤meta分析,鉴定出31个新的潜在影响黑色素瘤的易感位点,总计有85个皮肤黑色素瘤易感基因座被发现。
文章链接:https://www.ncbi.nlm.nih.gov/pubmed/32341527
公开的数据:dbGaP:phs001868.v1.p1
三
文献题目:Parallel genetic origin of foot feathering in birds
不想看英文题目:鸟类足部羽毛的平行遗传起源
杂志和影响因子:Mol Biol Evol (IF: 14.797)
样本量:169个样本,87个品种,表型分为足部有羽毛和足部没羽毛,按case,control分析。
分析方法:GWAS分析和CNV分析鉴定影响足部羽毛的关键基因和拷贝变异、系统发育分析控制足部羽毛单倍型的起源、使用PhastCons分析影响足部羽毛的区域是否为保守元件、RNA-SEQ分析鉴定与足部羽毛表型相关的上下调基因。
结论:GWAS分析发现有两个位点控制鸡足部是否有羽毛,分别在13和15号染色体。CNV分析发现在H2AFY基因上游区域有一个17kb的缺失与足部羽毛性状有关。系统发育树的结果表明足部羽毛性状为单一起源,与足部羽毛相关的变异为高度保守区域,此外,研究者还发现,TBX5在有足部羽毛的鸡后肢是上调的,与鸽子的结果相似,说明鸽子和鸡都经历了平行演化
文章链接:https://www.ncbi.nlm.nih.gov/pubmed/32344429
四
文献题目:The ChinaMAP analytics of deep whole genome sequences in 10,588 individuals
不想看英文题目:高达10,588个中国人群的深度全基因组测序分析
杂志和影响因子:Cell Res (IF: 17.848)
样本量:10,588个中国人,27个省,8个民族(汉族,回族,满族,苗族,蒙古族,彝族,藏族和壮族)
结论:ChinaMAP汇集了10,588人的深度全测序数据和代谢数据,为中国人群特有的代谢遗传风险提供新的视角。
文章链接:https://www.ncbi.nlm.nih.gov/pubmed/32355288
可用资源:www.mBiobank.com
五
文献题目:Genetic aetiology of blood pressure relates to aortic stiffness with bi-directional causality: evidence from heritability, blood pressure polymorphisms, and Mendelian randomization
不想看英文题目:血压和主动脉僵硬度之间的双向孟德尔随机化分析
杂志和影响因子:Eur Heart J (IF: 23.239)
样本量:TwinsUK的3531对同卵和异卵双胞胎数据
分析方法:评估双胞胎的血压和主动脉僵硬度遗传度、评估双胞胎共享的环境因素对表型的影响。通过单样本双向孟德尔随机化和双样本孟德尔随机化确定血压和主动脉僵硬的因果关系。
结论:个体的血压不仅由血压的遗传因素影响,还受主动脉僵硬度的遗传因素介导。孟德尔随机化表明血压与主动脉僵硬度之间存在双向因果关系。
文章链接:https://www.ncbi.nlm.nih.gov/pubmed/32357239
以上是关于每周文献马铃薯泛基因组揭示进化历史的主要内容,如果未能解决你的问题,请参考以下文章