基于参考n维数组对n维数组进行操作的最有效方法

Question

我有两个相同形状的Numpy数组：dat_ara和ref_ara。

我想对op_func的axis = -1执行操作dat_ara，但是我只想对每个数组中选定的值切片进行操作，当超过阈值thres时指定切片通过参考数组ref_ara。

为了说明，在简单的情况下，数组只是2维，我有：

thres = 4

op_func = np.average

ref_ara = array([[1, 2, 1, 4, 3, 5, 1, 5, 2, 5],
                 [1, 2, 2, 1, 1, 1, 2, 7, 5, 8],
                 [2, 3, 2, 5, 1, 6, 5, 2, 7, 3]]) 

dat_ara = array([[1, 0, 0, 1, 1, 1, 1, 0, 1, 1],
                 [1, 1, 1, 1, 1, 1, 1, 0, 1, 0],
                 [1, 0, 1, 1, 1, 1, 0, 1, 1, 1]])

[我们看到在thres的axis=0中的第一，第二和第三数组的第五，第七和第三索引中违反了ref_ara。因此，我想要的结果将是

out_ara = array([op_func(array([1, 0, 0, 1, 1, 1]), 
                 op_func(array([1, 1, 1, 1, 1, 1, 1, 0]),
                 op_func(array([1, 0, 1, 1])])

此问题很困难，因为它需要参考ref_ara。如果不是这种情况，我可以简单地使用numpy.apply_along_axis。

我已经尝试扩展两个数组的维，以将它们关联以进行计算，即：

assos_ara = np.append(np.expand_dims(dat_ara, axis=-1), np.expand_dims(ref_ara, axis=-1), axis=-1)

但是同样，numpy.apply_along_axis要求输入函数只能在1维数组上运行，因此我仍然无法使用该函数。

我知道的另一种方法是明智地遍历数组索引，但是，由于数组的两个数组的尺寸不断变化，这是一件棘手的事，而且，它的计算效率也不高。

我想尽可能地使用矢量化函数来辅助此过程。最有效的方法是什么？