加快将数据导入 Neo4j 图形数据库的速度

Posted

技术标签:

【中文标题】加快将数据导入 Neo4j 图形数据库的速度【英文标题】:Speeding up import of data into Neo4j graph database 【发布时间】:2012-09-24 22:11:13 【问题描述】:

我正在做一个项目,我们必须通过读取带有节点信息的 xml 文件来创建图形,我已经有了这一部分,但是创建节点和关系的过程太长了,需要 31 分钟在具有 Core 2 Duo、6GB RAM、Windows 和 Fedora 16 分钟的计算机上,在其他计算机上 Core i5 和 4GB RAM 大约需要。 3 分钟,在 Core i7 计算机上。

所以,我的问题是,怎么了?我可以做些什么来加速这个过程?

我修改了neo4j.properties的配置文件,一点效果都没有,持续时间太长,你知道吗?

谢谢。

【问题讨论】:

您能否展示一些您的代码,以便我们了解您是如何添加数据的?您要添加多少个节点和关系,它们有什么属性吗?更多细节会有所帮助... 你使用批量插入还是事务? 请提供有关 xml 语法和您的导入方法的更多数据。我个人使用了 gremlin graphML.import(),它在 linux 服务器和 windows 笔记本电脑上花费了相同的时间。 巴勃罗你找到原因了吗? 【参考方案1】:

您是在问我们为什么两台机器之间的速度如此之慢,还是只是一般而言?

也许您可以向我们提供有关您正在使用此导入执行的操作的信息?

我问是因为我自己使用过批处理插入器,并且某些操作可能需要比其他操作更长的时间,例如索引查找。然而,我的用例允许我通过利用并行编程将负载优化 1 个数量级。

您能否向我们提供更多信息?

【讨论】:

以上是关于加快将数据导入 Neo4j 图形数据库的速度的主要内容,如果未能解决你的问题,请参考以下文章

Neo4J与NeoModel:如何加速图形创建?

走向图形数据库:MariaDB首席技术官为何加入Neo4j

Neo4j - 图形数据科学库 - 如何对图形目录中的命名图形进行密码查询?

Neo4j 第五篇:批量更新数据

Neo4j 第五篇:批量更新数据

图形数据库Neo4J简介