如何在 Python 中创建类似于以下代码示例的径向集群?

Posted

技术标签:

【中文标题】如何在 Python 中创建类似于以下代码示例的径向集群?【英文标题】:How do I create a radial cluster like the following code-example in Python? 【发布时间】:2011-07-02 14:54:21 【问题描述】:

我找到了几个关于如何创建这些精确层次结构(至少我相信它们是)的示例,如下所示***.com/questions/2982929/,它们效果很好,并且几乎可以执行我正在寻找的内容。

[编辑]这是Paul 代码的简化版本,现在应该更容易有人帮助将其放入径向集群而不是当前的集群形状

import scipy
import pylab
import scipy.cluster.hierarchy as sch

def fix_verts(ax, orient=1):
    for coll in ax.collections:
        for pth in coll.get_paths():
            vert = pth.vertices
            vert[1:3,orient] = scipy.average(vert[1:3,orient]) 

# Generate random features and distance matrix.
x = scipy.rand(40)
D = scipy.zeros([40,40])
for i in range(40):
    for j in range(40):
        D[i,j] = abs(x[i] - x[j])

fig = pylab.figure(figsize=(8,8))

# Compute and plot the dendrogram.
ax2 = fig.add_axes([0.3,0.71,0.6,0.2])
Y = sch.linkage(D, method='single')
Z2 = sch.dendrogram(Y)
ax2.set_xticks([])
ax2.set_yticks([])

fix_verts(ax2,0)
fig.savefig('test.png')

但我需要如下图所示的径向集群,而不是树状结构。

【问题讨论】:

您的代码示例为线性轴制作树状图。您的图像示例有一个圆周轴。我不清楚您是想在箱形图的径向图中找到“Y”形分支,还是要重现径向图。 看看这个例子:matplotlib.sourceforge.net/examples/axes_grid/… 必须有一种方法可以对这个直线图应用变换以获得你想要的。今天早上我花了一点时间,但没有成功。 【参考方案1】:

我对这个问题进行了更多研究,现在似乎最好直接从linkage 输出创建一个新函数来绘制radial cluster(而不是破解绘制的函数)。我最终可能会做点什么,但很快就什么都做不了了。

我假设您的数据自然承认这种径向嵌入。你验证了吗? linkage 中是否存在适合您目的的方法?

似乎对于任何方法linkage 都会返回一个二叉树结构。在您的示例中,您有更通用的树。您需要一些额外的知识来整合树节点。一切就绪,破解原始树状图的想法无效。

更新: 对于您的目的,这个幼稚的示例情节是否足够合理?如果是这样,我将能够发布一些非常简单的代码来实现它。

更新 2

代码如下:

radial_demo.py

from numpy import r_, ones, pi, sort
from numpy.random import rand
from radial_grouper import tree, pre_order, post_order
from radial_visualizer import simple_link
from pylab import axis, figure, plot, subplot

# ToDo: create proper documentation
def _s(sp, t, o):
    subplot(sp)
    t.traverse(simple_link, order= o)
    axis('equal')

def demo1(n):
    p= r_[2* pi* rand(1, n)- pi, ones((1, n))]
    t= tree(p)
    f= figure()
    _s(221, t, pre_order)
    _s(222, t, post_order)
    t= tree(p, tols= sort(2e0* rand(9)))
    _s(223, t, pre_order)
    _s(224, t, post_order)
    f.show()
    # f.savefig('test.png')

# ToDO: implement more demos

if __name__ == '__main__':
    demo1(123)

radial_grouper.py

"""All grouping functionality is collected here."""
from collections import namedtuple
from numpy import r_, arange, argsort, array, ones, pi, where
from numpy import logical_and as land
from radial_support import from_polar

__all__= ['tree', 'pre_order', 'post_order']

Node= namedtuple('Node', 'ndx lnk')

# ToDo: enhance documentation
def _groub_by(p, tol, r):
    g, gm, gp= [], [], p- p[0]
    while True:
        if gp[-1]< 0: break
        ndx= where(land(0.<= gp, gp< tol))[0]
        if 0< len(ndx):
            g.append(ndx)
            gm.append(p[ndx].mean())
        gp-= tol
    return g, array([gm, [r]* len(gm)])

def _leafs(p):
    return argsort(p[0])

def _create_leaf_nodes(ndx):
    nodes= []
    for k in xrange(len(ndx)):
        nodes.append(Node(ndx[k], []))
    return nodes

def _link_and_create_nodes(_n, n_, cn, groups):
    nodes, n0= [], 0
    for k in xrange(len(groups)):
        nodes.append(Node(n_+ n0, [cn[m] for m in groups[k]]))
        n0+= 1
    return n_, n_+ n0, nodes

def _process_level(nodes, polar, p, tol, scale, _n, n_):
    groups, p= _groub_by(p, tol, scale* polar[1, _n])
    _n, n_, nodes= _link_and_create_nodes(_n, n_, nodes, groups)
    polar[:, _n: n_]= p
    return nodes, polar, _n, n_

def _create_tree(p, r0, scale, tols):
    if None is tols:
        tols= .3* pi/ 2** arange(5)[::-1]
    _n, n_= 0, p.shape[1]
    polar= ones((2, (len(tols)+ 2)* n_))
    polar[0, :n_], polar[1, :n_]= p[0], r0
    # leafs
    nodes= _create_leaf_nodes(_leafs(p))
    nodes, polar, _n, n_= _process_level(
    nodes, polar, polar[0, _leafs(p)], tols[0], scale, _n, n_)
    # links
    for tol in tols[1:]:
        nodes, polar, _n, n_= _process_level(
        nodes, polar, polar[0, _n: n_], tol, scale, _n, n_)
    # root
    polar[:, n_]= [0., 0.]
    return Node(n_, nodes), polar[:, :n_+ 1]

def _simplify(self):
    # ToDo: combine single linkages
    return self._root

def _call(self, node0, node1, f, level):
    f(self, [node0.ndx, node1.ndx], level)

def pre_order(self, node0, f, level= 0):
    for node1 in node0.lnk:
        _call(self, node0, node1, f, level)
        pre_order(self, node1, f, level+ 1)

def post_order(self, node0, f, level= 0):
    for node1 in node0.lnk:
        post_order(self, node1, f, level+ 1)
        _call(self, node0, node1, f, level)

class tree(object):
    def __init__(self, p, r0= pi, scale= .9, tols= None):
        self._n= p.shape[1]
        self._root, self._p= _create_tree(p, r0, scale, tols)

    def traverse(self, f, order= pre_order, cs= 'Cartesian'):
        self.points= self._p
        if cs is 'Cartesian':
            self.points= from_polar(self._p)
        order(self, self._root, f, 0)
        return self

    def simplify(self):
        self._root= _simplify(self)
        return self

    def is_root(self, ndx):
        return ndx== self._p.shape[1]- 1

    def is_leaf(self, ndx):
        return ndx< self._n

if __name__ == '__main__':
    # ToDO: add tests
    from numpy import r_, round
    from numpy.random import rand
    from pylab import plot, show

    def _l(t, n, l):
        # print round(a, 3), n, l, t.is_root(n[0]), t.is_leaf(n[1])
        plot(t.points[0, n], t.points[1, n])
        if 0== l:
            plot(t.points[0, n[0]], t.points[1, n[0]], 's')
        if t.is_leaf(n[1]):
            plot(t.points[0, n[1]], t.points[1, n[1]], 'o')

    n= 123
    p= r_[2* pi* rand(1, n)- pi, ones((1, n))]
    t= tree(p).simplify().traverse(_l)
    # t= tree(p).traverse(_l, cs= 'Polar')
    show()
    # print
    # t.traverse(_l, post_order, cs= 'Polar')

radial_support.py

"""All supporting functionality is collected here."""
from numpy import r_, arctan2, cos, sin
from numpy import atleast_2d as a2d

# ToDo: create proper documentation strings
def _a(a0, a1):
    return r_[a2d(a0), a2d(a1)]

def from_polar(p):
    """(theta, radius) to (x, y)."""
    return _a(cos(p[0])* p[1], sin(p[0])* p[1])

def to_polar(c):
    """(x, y) to (theta, radius)."""
    return _a(arctan2(c[1], c[0]), (c** 2).sum(0)** .5)

def d_to_polar(D):
    """Distance matrix to (theta, radius)."""
    # this functionality is to adopt for more general situations
    # intended functionality:
    # - embedd distance matrix to 2D
    # - return that embedding in polar coordinates
    pass

if __name__ == '__main__':
    from numpy import allclose
    from numpy.random import randn
    c= randn(2, 5)
    assert(allclose(c, from_polar(to_polar(c))))

    # ToDO: implement more tests

radial_visualizer.py

"""All visualization functionality is collected here."""
from pylab import plot

# ToDo: create proper documentation
def simple_link(t, ndx, level):
    """Simple_link is just a minimal example to demonstrate what can be
    achieved when it's called from _grouper.tree.traverse for each link.
    - t, tree instance
    - ndx, a pair of (from, to) indicies
    - level, of from, i.e. root is in level 0
    """
    plot(t.points[0, ndx], t.points[1, ndx])
    if 0== level:
        plot(t.points[0, ndx[0]], t.points[1, ndx[0]], 's')
    if t.is_leaf(ndx[1]):
        plot(t.points[0, ndx[1]], t.points[1, ndx[1]], 'o')

# ToDO: implement more suitable link visualizers
# No doubt, this will the part to burn most of the dev. resources

if __name__ == '__main__':
    # ToDO: implement tests
    pass

您可以找到源代码here。请随意修改它,但请保持未来的修改与要点同步。

【讨论】:

我想我不清楚为什么不应该只使用networkx 解决方案,除非他们真的想重新发明***并且有一种不需要额外依赖的方法. GraphViz 是专门为此目的而设计的强大工具。 networkx 解决方案很好,如果您可以使用其术语描述如何从它所描述的“平衡树”G=nx.balanced_tree(3,5) 变为不平衡树。我的示例图片很好地展示了这一点,并非所有叶节点的计数都相同〜 @Morvern -- 有关如何在 networkx 中创建 unbalanced_tree 的详细信息,请参阅我的原始答案所附的评论 @Morvern:用源代码的位置更新了我的答案。谢谢【参考方案2】:

我相信您可以将networkx 包与matplotlib 结合使用。从networkx 库中查看以下示例:

http://networkx.lanl.gov/examples/drawing/circular_tree.html

总的来说networkx 有很多非常好的图表分析和绘图方法

【讨论】:

不幸的是,代码在 pos=nx.graphviz_layout(G,prog='twopi',args='') 行上完全出错。然而,进口似乎工作得很好。按版本进行,我得到了版本 nx.__version__ 1.0rc1(networkx 版本 1.0rc1) 我认为问题在于您需要单独安装 GraphViz,因为我在运行示例代码时得到的具体错误是:InvocationException: GraphViz's executables not found,但理论上如果您拥有所有必要的组件,那么这段代码应该可以满足您的需求。请参阅networkx.lanl.gov/install.html 以获取包括 GraphViz 在内的可选包的链接 就是这样,需要单独安装它〜创造了上面的例子的魅力,但我不是在寻找平衡树,我的例子显示了一个不平衡的树,随机节点之间的连接为好吧。第一个就是最好的例子。关于networkx是否支持这个的任何指针? balanced_tree 只是在示例中用于演示 networkx 的绘图能力,特别是圆形图布局。这里有许多经典的图生成器:networkx.lanl.gov/reference/generators.html,包括随机图。您可以使用其中之一或使用包图原语创建自己的自定义网络/图。 这里是另一个链接:networkx.github.io/documentation/networkx-1.9/examples/drawing/…【参考方案3】:

我添加了一个函数fix_verts,它合并了树状图中每个“U”底部的顶点。

试试这个:

import scipy
import pylab
import scipy.cluster.hierarchy as sch

def fix_verts(ax, orient=1):
    for coll in ax.collections:
        for pth in coll.get_paths():
            vert = pth.vertices
            vert[1:3,orient] = scipy.average(vert[1:3,orient]) 

# Generate random features and distance matrix.
x = scipy.rand(40)
D = scipy.zeros([40,40])
for i in range(40):
    for j in range(40):
        D[i,j] = abs(x[i] - x[j])


fig = pylab.figure(figsize=(8,8))

# Compute and plot first dendrogram.
ax1 = fig.add_axes([0.09,0.1,0.2,0.6])
Y = sch.linkage(D, method='centroid')
Z1 = sch.dendrogram(Y, orientation='right')
ax1.set_xticks([])
ax1.set_yticks([])

# Compute and plot second dendrogram.
ax2 = fig.add_axes([0.3,0.71,0.6,0.2])
Y = sch.linkage(D, method='single')
Z2 = sch.dendrogram(Y)
ax2.set_xticks([])
ax2.set_yticks([])

# Plot distance matrix.
axmatrix = fig.add_axes([0.3,0.1,0.6,0.6])
idx1 = Z1['leaves']
idx2 = Z2['leaves']
D = D[idx1,:]
D = D[:,idx2]
im = axmatrix.matshow(D, aspect='auto', origin='lower', cmap=pylab.cm.YlGnBu)
axmatrix.set_xticks([])
fix_verts(ax1,1)
fix_verts(ax2,0)
fig.savefig('test.png')

结果是这样的:

我希望这就是你所追求的。

【讨论】:

很有趣,但它看起来不像OP提供的任何一张图片......【参考方案4】:

Vega 有一个 example 与您的第一个图表非常相似。

您可以在他们的在线编辑器上使用它。超级酷且易于使用。

【讨论】:

以上是关于如何在 Python 中创建类似于以下代码示例的径向集群?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Python 中创建一个行为类似于 Django 抽象基类的类?

如何在UWP App中创建信息丰富的Toast通知

如何在 postgresql 中创建只读视图,类似于 oracle?

如何在 SQL Server [2005] 中创建类似于 .dbo 的架构

在python中创建日期时间索引

如何在 Python 中创建分类气泡图?