对 numpy 数组的每 n 个元素进行平均

Posted

技术标签:

【中文标题】对 numpy 数组的每 n 个元素进行平均【英文标题】:Averaging over every n elements of a numpy array 【发布时间】:2013-04-04 02:13:04 【问题描述】:

我有一个 numpy 数组。我想创建一个新数组,它是每个连续三元组元素的平均值。所以新数组的大小将是原始数组的三分之一。

举个例子:

 np.array([1,2,3,1,2,3,1,2,3])

应该返回数组:

 np.array([2,2,2])

任何人都可以提出一种有效的方法吗?我正在画空白。

【问题讨论】:

【参考方案1】:

如果您的数组 arr 的长度可以被 3 整除:

np.mean(arr.reshape(-1, 3), axis=1)

重塑为更高维的数组,然后在其中一个附加维度上执行某种形式的 reduce 操作是 numpy 编程的主要内容。

【讨论】:

Jaime - 谢谢,这是一种非常优雅的做事方式。你对在哪里可以阅读这些所谓的“numpy 编程的主要内容”有什么建议吗? 如果arr长度不能被3整除,你可以这样做:arr = np.nanmean(np.pad(arr.astype(float), (0, 3 - arr.size%3), mode='constant', constant_values=np.NaN).reshape(-1, 3), axis=1) @plong0 的填充评论帮助了我,但为了使其通用,即使您的数组也可被 3 整除,我也必须在填充大小中添加另一个 mod:( 0, ((3 - arr.size%3) % 3) ) ,或类似( 0, 0 if arr.size % 3 == 0 else 3 - arr.size % 3 ) 对于不一定能被 3 整除的数组,我使用了np.mean(arr[:(len(arr)//3)*3].reshape(-1,3), axis=1),这对我来说似乎要简单得多。我相信这适用于 python2 和 python3 @Chris 那不一样,因为它只是丢弃最后一组中的数据(如果不是 3 组),而上面的解决方案也适用于剩余组。跨度> 【参考方案2】:

对于希望对多维数组进行简单概括的 Google 用户:scikit-image 模块 (link to docs) 中的函数 block_reduce

它有一个非常简单的接口来通过应用诸如numpy.mean 之类的函数来对数组进行下采样,但也可以使用其他函数(最大值、中值、...)。通过为块提供具有不同大小的元组,可以通过针对不同轴的不同因素来完成下采样。这是一个二维数组的例子;使用均值仅对轴 1 下采样 5:

import numpy as np
from skimage.measure import block_reduce

arr = np.stack((np.arange(1,20), np.arange(20,39)))

# array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
#        [20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38]])

arr_reduced = block_reduce(arr, block_size=(1,5), func=np.mean, cval=np.mean(arr))

# array([[ 3. ,  8. , 13. , 17.8],
#        [22. , 27. , 32. , 33. ]])

正如在 cmets 中对另一个答案的讨论:如果缩减维度中的数组不能被块大小整除,则填充值由参数 cval 提供(默认为 0)。

【讨论】:

酷!感谢您的多维度解决方案;)【参考方案3】:

将接受的答案应用于每个列/特征的二维数组:

arr.reshape(-1, downsample_ratio, arr.shape[1]).mean(axis = 1)

【讨论】:

以上是关于对 numpy 数组的每 n 个元素进行平均的主要内容,如果未能解决你的问题,请参考以下文章

Numpy 二维移动平均线

对 numpy 数组进行二次采样/平均

如何找到一个numpy数组的多个均匀分布的方法?

将多个数组的每一项平均到一个数组中

二维数组的 Numpy 元素平均计算

我如何以向量化方式对矩阵中的每个第n个元素求平均?