新冠病毒知识图谱|图数据库能做什么
Posted 区块链大本营
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了新冠病毒知识图谱|图数据库能做什么相关的知识,希望对你有一定的参考价值。
图可视化直观、智能地展现数据之间的结构和关联
能看到从前在表格或者图表中看不到的内容
——本文节选自《新程序员》文章
随着大数据时代的到来,传统的关系型数据库由于其在数据建模和存储方面的限制,变得越来越难以满足大量频繁变化的需求。关系型数据库,尽管其名称中有“关系”这个词,却并不擅长处理复杂关系的查询和分析。另外,关系型数据库也缺乏在多服务器之上进行水平扩展的能力。基于此,一类非关系型数据库,统称“NoSQL”存储应运而生,并且很快得到广泛研究和应用。
NoSQL(Not Only SQL,非关系型数据库)是一类范围广泛、类型多样的数据持久化解决方案。它们不遵循关系型数据库模型,也不使用SQL作为查询语言。其数据存储不需要固定的表格模式,也经常会避免使用SQL的JOIN操作,一般都有水平可扩展的特征。
图数据库与关系型数据库的比较
图数据库(Graph Database)是指以图表示、存储和查询数据的一类数据库。这里的“图”,与图片、图形、图表等没有关系,而是基于数学领域的“图论”概念,通常用来描述某些事物之间的某种特定关系。比如在我们的日常生活中:
社交网络是图。每个社交网络的参与者是节点,我们在社交网络中的交互,例如“加好友”“点赞”就是连接节点的边。
城市交通是图。每个路口、门牌号、公交站点等都是节点,街道或者公交线路是边,将可以到达的地方连接起来。
知识也是图。每个名称、概念、人物、事件等都是节点,而类属关系、分类关系、因果关系等是边,将节点连接起来,形成庞大、丰富并且随时在演变的知识图谱。
“图无处不在”(Graphs are everywhere),也正因如此,传统关系型数据库不擅长处理关系的问题,能够被图数据库很好地解决,图数据库正是为解决这一问题而生。
关于新冠病毒的知识图谱
新冠病毒肆虐全球,来自Neo4j图数据库社区的一群成员,集成了多个异构生物医学和环境数据集,建立了关于新冠病毒的知识图谱
https://github.com/covid-19-net/covid-19-community
以帮助研究人员分析宿主、病原体、环境和病毒之间的相互作用。
关于新冠病毒的知识图谱
该知识图谱的部分可视化结果,图中最左边的部分是病毒暴发的地理位置子图,包含国家、地区、城市;
中间绿色的部分是流行病学子图,包括有关病毒株、病原体和宿主生物的信息,病例和菌株分别与报告和发现它们的位置相关联;
右边紫色的部分是生物学子图,代表生物体、基因组、染色体、变异体等。
《新程序员》004期上线
扫描二维码,限制折扣图书送到家
还有电子版送
图数据库未来大放异彩
在金融领域,图和图分析帮助机构更高效地发现异常的关联交易,以赢得反洗钱战争。
在电力、电信行业,图数据库帮助管理复杂庞大的设备和线路网络,并及时为故障分析根源、估算影响。
在制造、科研、医药等领域,图数据库广泛用于存储和查询知识图谱,成为大数据管理、数据分析和价值挖掘乃至人工智能技术领域的重要支撑。
在可预见的未来内,图数据库与人工智能技术的结合应用将会带来更多创新和飞跃。图数据库至少能在以下四个领域帮助提升AI能力。
数据库技术发展趋势(截至2021年6月)来源:DB-Engines
第一是知识图谱,它为决策支持提供领域相关知识/上下文,并且帮助确保答案适合于该特定情况。
第二,图提供更高的处理效率,因此借助图来优化模型并加速学习过程,可以有效地增强机器学习的效率。
第三,基于数据关系的特征提取分析可以识别数据中最具预测性的元素。基于数据中发现的强特征所建立的预测模型拥有更高的准确性。
第四,图提供了一种保证AI决策透明度的方法,这使得通过AI得到的结论更加具有可解释性。AI和机器学习具有很大的应用潜力,而图解锁了这种潜力。这是因为图数据库技术支持领域相关知识和关联数据,使AI变得更广泛适用。
《新程序员》数据库文章作者
近年来,云端部署的图数据库(SaaS/DaaS)成为了又一个发展趋势。国内的众多大厂纷纷推出自研的云端图数据库产品,例如百度的HugeGraph、阿里的GDB、腾讯的TGDB、华为的GES图计算引擎。
就总体趋势而言,我们能够预见,大数据时代,数据缺失不再是最大的挑战,我们渴求的是挖掘数据价值的能力,而数据的价值很大一部分在于数据之间的关联。图数据库和图分析作为处理关联数据最有效的技术和方法,一定会继续大放异彩,书写数据库应用的新篇章。
与我共读《新程序员》
欢迎入群交流
更多阅读
以上是关于新冠病毒知识图谱|图数据库能做什么的主要内容,如果未能解决你的问题,请参考以下文章