使用 cProfile 分析 numpy 没有给出有用的结果

Posted

技术标签:

【中文标题】使用 cProfile 分析 numpy 没有给出有用的结果【英文标题】:profiling numpy with cProfile not giving useful results 【发布时间】:2013-12-06 21:39:34 【问题描述】:

这段代码:

import numpy as np
import cProfile

shp = (1000,1000)
a = np.ones(shp)
o = np.zeros(shp)

def main():
    np.divide(a,1,o)
    for i in xrange(20):
        np.multiply(a,2,o)
        np.add(a,1,o)

cProfile.run('main()')

仅打印:

         3 function calls in 0.269 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.269    0.269 <string>:1(<module>)
        1    0.269    0.269    0.269    0.269 testprof.py:8(main)
        1    0.000    0.000    0.000    0.000 method 'disable' of '_lsprof.Prof
iler' objects

我可以让 cProfile 与 numpy 一起工作,告诉我它对各种 np.* 调用进行了多少次调用,以及每次调用花费了多少时间?

编辑

按照 hpaulj 的建议单独包装每个 numpy 函数太麻烦了,所以我正在尝试这样的方法来临时包装许多或所有感兴趣的函数:

def wrapper(f, fn):
    def ff(*args, **kwargs):
        return f(*args, **kwargs)
    ff.__name__ = fn
    ff.func_name = fn
    return ff

for fn in 'divide add multiply'.split():
    f = getattr(np, fn)
    setattr(np, fn, wrapper(f, fn))

但 cProfile 仍将 all 称为ff

【问题讨论】:

【参考方案1】:

如何将相关调用封装在 Python 函数中?

def mul(*args):
    np.multiply(*args)
def add(*args):
    np.add(*args)

def main():
    np.divide(a,1,o)
    for i in xrange(20):
        mul(a,2,o)
        add(a,1,o)

这基本上是这个 SO 线程中关于改进分析粒度的想法 - 它分析函数调用,而不是行。

Does effective Cython cProfiling imply writing many sub functions?

【讨论】:

点,但这对于我的真实分析来说太麻烦了。我尝试了一些自动包装,但失败了(如果需要,请参阅编辑)我什至尝试过这个:code.activestate.com/recipes/… 但那里也有问题。

以上是关于使用 cProfile 分析 numpy 没有给出有用的结果的主要内容,如果未能解决你的问题,请参考以下文章

cProfile 没有方法 runcall

使用 Argument Parser 的函数上的 cProfile

cProfile 没有属性 runctx

python性能分析--cProfile

Spyder 分析器使用 cProfile 还是 Profile?

cProfile 配置文件在线程内调用吗?