在多个维度上平均 numpy 掩码数组

Posted

技术标签:

【中文标题】在多个维度上平均 numpy 掩码数组【英文标题】:Averaging numpy masked array over multiple dimensions 【发布时间】:2016-04-20 15:15:37 【问题描述】:

可以在多个维度上计算 numpy 数组的平均值,例如。 my_ndarray.mean(axis=(1,2))

但是,它似乎不适用于 屏蔽数组

>>> import numpy as np
>>> a = np.random.randint(0, 10, (2, 2, 2))
>>> a
array([[[0, 9],
        [2, 5]],

       [[8, 6],
        [0, 7]]])
>>> a.mean(axis=(1, 2))
array([ 4.  ,  5.25])
>>> ma = np.ma.array(a, mask=(a < 5))
>>> ma.mean(axis=(1, 2))
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.7/site-packages/numpy/ma/core.py", line 5066, in mean
    cnt = self.count(axis=axis)
  File "/usr/lib/python2.7/site-packages/numpy/ma/core.py", line 4280, in count
    n1 = np.size(m, axis)
  File "/usr/lib/python2.7/site-packages/numpy/core/fromnumeric.py", line 2700, in size
    return a.shape[axis]
TypeError: tuple indices must be integers, not tuple

如何计算屏蔽数组在多个轴上的平均值,最好与普通数组一样简单?

(我宁愿使用不意味着定义新函数的解决方案,如this answer 中所建议的那样。)

【问题讨论】:

你试过ma.mean(2).mean(1)吗? @wflynny :这个答案应该有效。以防万一,他只想计算“未屏蔽值”的平均值。 有关未实现元组索引的更多详细信息,请参阅this question。 @wflynny:这是我的第一个猜测,但它改变了赋予每个值的权重。与以前的例如。它返回 [7, 7.25] 而不是 [7, 7] 应该的。 (另外,应该是ma.mean(1).mean(1)。) 【参考方案1】:

我发现虽然np.ma.mean 不起作用,但np.ma.average 给出了预期的结果:

>>> np.ma.average(ma, axis=(1,2))
masked_array(data = [7.0 7.0],
             mask = [False False],
       fill_value = 1e+20)

这很令人困惑,因为对于常规数组,np.average 只是 np.mean 的包装。但只要有效,我不会抱怨!

【讨论】:

【参考方案2】:

你可以在平均值之前重塑它:

>>>ma.reshape(mc.shape[0],-1).mean(1)
masked_array(data = [1.6666666666666667 4.0],
         mask = [False False],
         fill_value = 1e+20)

请注意,部分应用平均会导致结果模棱两可:

>>> ma.mean(1).mean(1)
masked_array(data = [1.5 4.0],
             mask = [False False],
       fill_value = 1e+20)


>>> ma.mean(2).mean(1)
masked_array(data = [2.25 4.0],
             mask = [False False],
       fill_value = 1e+20)

解释:

>>>ma
masked_array(data =
 [[[0 1]
  [4 --]]

 [[-- --]
  [-- 4]]],
             mask =
 [[[False False]
  [False  True]]

 [[ True  True]
  [ True False]]],
       fill_value = 999999)

每种情况下的权重都不相同。

要在其他维度上取平均值,可以先使用 np.rollaxis。

【讨论】:

以上是关于在多个维度上平均 numpy 掩码数组的主要内容,如果未能解决你的问题,请参考以下文章

在多个日期维度层次结构上查找平均值

基于 2D 数组的 3D numpy 切片的平均值

Numpy 二维移动平均线

如何找到一个numpy数组的多个均匀分布的方法?

二维数组的 Numpy 元素平均计算

如何找到numpy数组的每两行的平均值