通过Py2neo在Neo4j中建立关系非常缓慢

Question

我们在数据库中有5种不同类型的节点。最大的一个有~290k，最小的只有~3k。每个节点类型都有一个id字段，它们都被编入索引。我正在使用py2neo建立关系，但它非常慢（每秒插入约2个关系）

我使用从csv关系中读取的pandas，迭代每一行以创建包含在事务中的关系。我尝试在一次交易中批量输出10k创建语句，但似乎并没有提高很多速度。

以下是代码：

df = pd.read_csv(r"C:
elationship.csv",dtype = datatype, skipinitialspace=True, usecols=fields)
df.fillna('',inplace=True)

def f(node_1 ,rel_type, node_2):
    try:
        tx = graph.begin()
        tx.evaluate('MATCH (a {node_id:$label1}),(b {node_id:$label2}) MERGE (a)-[r:'+rel_type+']->(b)',
                    parameters = {'label1': node_1, 'label2': node_2})
        tx.commit()
    except Exception as e:
        print(str(e))

for index, row in df.iterrows():
    if(index%1000000 == 0):
        print(index)
    try:
        f(row["node_1"],row["rel_type"],row["node_2"])
    except:
        print("error index: " + index)

有人可以帮我解决我在这里做错了什么。谢谢！

Answer 1

另一答案