科研人员研发出第二代微生物组搜索引擎MSE 2
Posted 中科院之声
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了科研人员研发出第二代微生物组搜索引擎MSE 2相关的知识,希望对你有一定的参考价值。
微生物组(“菌群”)是微生物在自然界的存在形式,在自然界中无处不在,塑造了人类社会的过去、现在和未来。因此,微生物组“大数据”的深度挖掘,是利用菌群实现精准诊断、精准护理与精准营养的重要工具,也是认识生物资源、监控环境健康、维护国家生物安全的新手段。近日,中国科学院青岛生物能源与过程研究所单细胞研究中心发布了第二代微生物组搜索引擎MSE 2(http://mse.ac.cn),以支撑更全面、更深入、更便捷的菌群大数据挖掘。1月20日,相关研究成果发表在mSystems(《美国微生物学会会刊》)上。
在海量的人类已知微生物组数据空间中,微生物组搜索引擎(MSE)针对新的菌群样本,以亚秒级别的反应时间寻找结构类似样本,从而全面、快速地挖掘新样本的特征。因此,MSE被誉为the Google of Microbiome。MSE 2从参照数据库、搜索引擎内核和用户界面等三个方面做了全面升级(图1)。具体来说,首先,相对于包含10万例16S rRNA扩增子测序样本的第一代MSE数据库,MSE 2中搜集、标准化分析和可视化了涵盖16S rRNA扩增子和鸟枪法元基因组类型的近27万个样本,是国内外生态系统覆盖最全面、样本数量最丰富的标准化元基因组数据库之一。其次,MSE 2的搜索引擎内核已完全兼容16S rRNA和鸟枪法两种测序数据,可从OTU[利用MSE,科研人员揭示了人类已知菌群在结构空间上的全局特征,并预测了微生物组领域最有科学潜力的方向(Su et al., mBio 2018)]。同时,MSE代表着一种依托菌群大数据的疾病检测新策略,在基于肠道菌群的一些慢病诊断上,它在回答“是否健康”和“哪种疾病”这两个问题上的准确率上均优于常用的机器学习算法,从而有效降低了“漏诊”和“误诊”几率(Su et al., mSystems 2020)。此外,由于其涵盖了全面、多维、海量的微生物组及其生境信息,MSE已成为评估微生态健康、评价微生态产品疗效的有力工具。基于其不断拓展的应用,MSE 2将成为遨游微生物组数据空间的“罗盘”,推动“数据驱动型”的微生态研究和大健康产业应用。
该研究由青岛能源所与青岛大学、中科院文献情报中心、中国海洋大学等合作完成。单细胞中心生物信息研究组助理研究员荆功超、刘璐为论文的共同第一作者,青岛大学教授苏晓泉与青岛能源所研究员徐健为论文的共同通讯作者。研究工作获得国家自然科学基金、山东省自然科学基金的支持。
第二代微生物组大数据搜索引擎MSE 2的整体框架
来源:中国科学院青岛生物能源与过程研究所
以上是关于科研人员研发出第二代微生物组搜索引擎MSE 2的主要内容,如果未能解决你的问题,请参考以下文章
技术干货 | 搜索那点事儿:Lucene文件存储和读取技术详解