当networkx中有数百个节点时如何避免重叠?

Posted

技术标签:

【中文标题】当networkx中有数百个节点时如何避免重叠?【英文标题】:How to avoid overlapping when there's hundreds of nodes in networkx? 【发布时间】:2018-08-31 23:20:12 【问题描述】:

我有 2000 多个节点和 900 多个边,但是当我尝试在 networkx 中制作图形时,我发现所有节点都挤在一起。我尝试更改属性值,例如比例、k。我发现它们没有用,因为下面有数百个带有标签的节点,这意味着我无法选择小尺寸的节点。我想知道是否有一种方法可以扩展画布或其他方法来增加节点的距离以避免重叠,这样我就可以清楚地看到每个节点及其标签。

谢谢

【问题讨论】:

评论(最初由@PavloMuts 作为答案发布):一些讨论已经在类似的问题上。你可以去看看here。 非常感谢!通过更改 alpha、nodesize、k 等参数,它有很大帮助,尽管我仍然无法完美地绘制图形。这真是一件困难的事情。 您可以考虑尝试其他一些可视化软件包。如果你想严格遵守 Python,我可能会推荐 the plotly Dash Cytoscape 包。 关于您的问题的相关主题,这里有一个出版物 (doi.org/10.1371/journal.pcbi.1007244),它可能有助于可视化您的数据。您甚至可能不需要绘制每个节点,或者您可以在绘制的内容上更加周到(即将相似的节点聚合在一起以便更容易可视化)。 【参考方案1】:

您可以使用 ploty 的交互式图表来绘制如此大量的节点和边。您可以更改每个属性,例如画布大小等,并通过缩放其他操作更轻松地对其进行可视化。 示例:

导入剧情

import plotly.graph_objects as go

import networkx as nx

将边添加为单个跟踪中的断开线,并将节点添加为分散跟踪

G = nx.random_geometric_graph(200, 0.125)
edge_x = []
edge_y = []
for edge in G.edges():
    x0, y0 = G.nodes[edge[0]]['pos']
    x1, y1 = G.nodes[edge[1]]['pos']
    edge_x.append(x0)
    edge_x.append(x1)
    edge_x.append(None)
    edge_y.append(y0)
    edge_y.append(y1)
    edge_y.append(None)

edge_trace = go.Scatter(
    x=edge_x, y=edge_y,
    line=dict(width=0.5, color='#888'),
    hoverinfo='none',
    mode='lines')

node_x = []
node_y = []
for node in G.nodes():
    x, y = G.nodes[node]['pos']
    node_x.append(x)
    node_y.append(y)

node_trace = go.Scatter(
    x=node_x, y=node_y,
    mode='markers',
    hoverinfo='text',
    marker=dict(
        showscale=True,
        # colorscale options
        #'Greys' | 'YlGnBu' | 'Greens' | 'YlOrRd' | 'Bluered' | 'RdBu' |
        #'Reds' | 'Blues' | 'Picnic' | 'Rainbow' | 'Portland' | 'Jet' |
        #'Hot' | 'Blackbody' | 'Earth' | 'Electric' | 'Viridis' |
        colorscale='YlGnBu',
        reversescale=True,
        color=[],
        size=10,
        colorbar=dict(
            thickness=15,
            title='Node Connections',
            xanchor='left',
            titleside='right'
        ),
        line_width=2))

按连接数为节点点着色。

另一种选择是通过连接数来确定点的大小,即 node_trace.marker.size = node_adjacencies

node_adjacencies = []
node_text = []
for node, adjacencies in enumerate(G.adjacency()):
    node_adjacencies.append(len(adjacencies[1]))
    node_text.append('# of connections: '+str(len(adjacencies[1])))

node_trace.marker.color = node_adjacencies
node_trace.text = node_text

创建网络图

fig = go.Figure(data=[edge_trace, node_trace],
             layout=go.Layout(
                title='<br>Network graph made with Python',
                titlefont_size=16,
                showlegend=False,
                hovermode='closest',
                margin=dict(b=20,l=5,r=5,t=40),
                annotations=[ dict(
                    text="Python code: <a href='https://plotly.com/ipython-notebooks/network-graphs/'> https://plotly.com/ipython-notebooks/network-graphs/</a>",
                    showarrow=False,
                    xref="paper", yref="paper",
                    x=0.005, y=-0.002 ) ],
                xaxis=dict(showgrid=False, zeroline=False, showticklabels=False),
                yaxis=dict(showgrid=False, zeroline=False, showticklabels=False))
                )
fig.show()

您可以在互联网上获取有关情节的更多详细信息 参见文档:https://plotly.com/python/network-graphs/

【讨论】:

【参考方案2】:

当我遇到同样的问题时,我想出了我希望我的节点在哪里,并将它们作为来自 csv 文件的 networkx 的输入:

f1 = csv.reader(open('nodes-C4-final.csv','r'),delimiter="\t")
for row in f1:
    G.add_node(row[0], label=row[1], weight = float(row[3]), pos =(float(row[4]),float(row[5])))

【讨论】:

以上是关于当networkx中有数百个节点时如何避免重叠?的主要内容,如果未能解决你的问题,请参考以下文章

如何绘制一个大的 ctree() 以避免重叠节点

标记外部节点,与networkx中的其他节点/边缘重叠最小

节点作为networkx中的格点

NetworkX节点属性绘制

如何使用networkx在图中显示节点名称? [复制]

networkx 通过欧几里得距离阈值构造图