想问一下图数据库neo4j和spark下面的graphx有啥区别
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了想问一下图数据库neo4j和spark下面的graphx有啥区别相关的知识,希望对你有一定的参考价值。
Neo4j就是一个数据库(可以理解成一个类似HBASE的东西,不过Neo4j是几乎是单机数据库,于HBASE不同,HBASE的数据时存储在HDFS上,由HDFS进行维护,HDFS将数据存储在exfat等单机文件系统上。Neo4j直接将数据格式化到单机文件系统)
每一个服务器保存完整的图数据。
GraphX是一个计算引擎(类似于mapreduce的东西),它的数据是从SHARK中使用SQL读取数据,或者RDD运算符从文件中读取,然后直接进行计算
另外数据库和计算引擎都可以进行计算任务,不过数据库的接口比较弱,只支持简单的查询
计算引擎提供了强大的计算接口,方便了编程,可以很容易的实现pagerank等图算法
GraphX做数据挖掘应该更方便,有通用的编程几口
Neo4j就需要自己写代码了 编程比较麻烦,不过性能上或许有优势 参考技术A spark这个大集体里不仅仅有 graphx 还有 streaming、ml 支持。
neo4j 应该只是一个图数据库吧?neo4j是图数据库,本身自带存储。
graphx是spark的一个图计算组件,基于RDD实现。
基本的图计算功能都具备,主要取决于你想用来做什么应用。本回答被提问者采纳
以上是关于想问一下图数据库neo4j和spark下面的graphx有啥区别的主要内容,如果未能解决你的问题,请参考以下文章