numpy 获取值为真的索引

Posted

技术标签:

【中文标题】numpy 获取值为真的索引【英文标题】:numpy get index where value is true 【发布时间】:2013-04-12 06:04:39 【问题描述】:
>>> ex=np.arange(30)
>>> e=np.reshape(ex,[3,10])
>>> e
array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29]])
>>> e>15
array([[False, False, False, False, False, False, False, False, False,
        False],
       [False, False, False, False, False, False,  True,  True,  True,
         True],
       [ True,  True,  True,  True,  True,  True,  True,  True,  True,
         True]], dtype=bool)

我需要在 e 中找到值为 true 的行或值大于 15 的行。我可以使用 for 循环进行迭代,但是,我想知道 numpy 是否有办法做到这一点有效吗?

【问题讨论】:

【参考方案1】:

获取至少一项大于 15 的行号:

>>> np.where(np.any(e>15, axis=1))
(array([1, 2], dtype=int64),)

【讨论】:

np.where 文档指出:“当仅提供条件时,此函数是 np.asarray(condition).nonzero() 的简写。应首选直接使用nonzero 因为它对子类行为正确。"【参考方案2】:

您可以使用nonzero 函数。它返回给定输入的非零索引。

简单的方法

>>> (e > 15).nonzero()

(array([1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2]), array([6, 7, 8, 9, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]))

要更清晰地查看索引,请使用transpose 方法:

>>> numpy.transpose((e>15).nonzero())

[[1 6]
 [1 7]
 [1 8]
 [1 9]
 [2 0]
 ...

不错的方式

>>> numpy.nonzero(e > 15)

(array([1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2]), array([6, 7, 8, 9, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]))

或干净的方式:

>>> numpy.transpose(numpy.nonzero(e > 15))

[[1 6]
 [1 7]
 [1 8]
 [1 9]
 [2 0]
 ...

【讨论】:

np.nonzero()np.where() 使用的 under the hood。 np.transpose(np.where(board==0)) 对我有用 感谢您提到需要转置数组。我花了半个小时质疑我为什么返回不存在的索引。【参考方案3】:

一种简单而干净的方法:使用np.argwhere按元素分组索引,而不是像np.nonzero(a)中的维度(即np.argwhere为每个非零元素返回一行)。

>>> a = np.arange(10)
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> np.argwhere(a>4)
array([[5],
       [6],
       [7],
       [8],
       [9]])

np.argwhere(a)np.transpose(np.nonzero(a)) 几乎相同,但它会生成正确形状的 0 维数组的结果。

注意:您不能使用a(np.argwhere(a>4)) 来获取a 中的对应值。推荐的方法是使用a[(a>4).astype(bool)]a[(a>4) != 0] 而不是a[np.nonzero(a>4)],因为它们可以正确处理0-d 数组。有关详细信息,请参阅documentation。从下面的例子可以看出,a[(a>4).astype(bool)]a[(a>4) != 0]可以简化为a[a>4]

另一个例子:

>>> a = np.array([5,-15,-8,-5,10])
>>> a
array([  5, -15,  -8,  -5,  10])
>>> a > 4
array([ True, False, False, False,  True])
>>> a[a > 4]
array([ 5, 10])
>>> a = np.add.outer(a,a)
>>> a
array([[ 10, -10,  -3,   0,  15],
       [-10, -30, -23, -20,  -5],
       [ -3, -23, -16, -13,   2],
       [  0, -20, -13, -10,   5],
       [ 15,  -5,   2,   5,  20]])
>>> a = np.argwhere(a>4)
>>> a
array([[0, 0],
       [0, 4],
       [3, 4],
       [4, 0],
       [4, 3],
       [4, 4]])
>>> for i,j in a: print(i,j)
... 
0 0
0 4
3 4
4 0
4 3
4 4
>>>

【讨论】:

【参考方案4】:

当您只需要行 idx 时,我更喜欢 np.flatnonzero(arr) 而不是 nonzero() 选项。 arr.nonzero() 有效,但它返回一个元组而不是一个数组。 flatnonzero() 等价于np.nonzero(np.ravel(arr))[0]

如 cmets 中所述,NumPy 文档不鼓励np.where()

【讨论】:

以上是关于numpy 获取值为真的索引的主要内容,如果未能解决你的问题,请参考以下文章

查找值为真的布尔数组的索引

python使用np.argsort对一维numpy概率值数据排序获取倒序索引获取的top索引(例如top2top5top10)索引二维numpy数组中对应的原始数据:原始数据概率最大的头部数据

python使用np.argsort对一维numpy概率值数据排序获取升序索引获取的top索引(例如top2top5top10)索引二维numpy数组中对应的原始数据:原始数据概率最小的头部数据

numpy

Numpy 索引,获取宽度为 2 的波段

Numpy Array 获取按行搜索的行索引