在 NumPy 数组中查找等于零的元素的索引

Posted

技术标签:

【中文标题】在 NumPy 数组中查找等于零的元素的索引【英文标题】:Find indices of elements equal to zero in a NumPy array 【发布时间】:2011-06-03 02:00:11 【问题描述】:

NumPy 具有有效的函数/方法nonzero() 来识别ndarray 对象中非零元素的索引。获取 值为 0 的元素的索引的最有效方法是什么?

【问题讨论】:

【参考方案1】:

numpy.where() 是我的最爱。

>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])
>>> numpy.where(x == 0)[0]
array([1, 3, 5])

【讨论】:

我正在努力记住 Python。为什么where() 返回一个元组? numpy.where(x == 0)[1] 越界。那么索引数组与什么耦合呢? @Zhubarb - 索引的大多数用途是元组 - np.zeros((3,)) 例如制作一个 3 长的向量。我怀疑这是为了使解析参数变得容易。否则像 np.zeros(3,0,dtype='int16')np.zeros(3,3,3,dtype='int16') 这样的东西会很烦人。 没有。 where 返回一个 ndarrays 的元组,每个元组对应于输入的一个维度。在这种情况下,输入是一个数组,所以输出是1-tuple。如果 x 是一个矩阵,它将是一个2-tuple,以此类推 从 numpy 1.16 开始,documentation for numpy.where 特别推荐直接使用numpy.nonzero,而不是只使用一个参数调用where @mLstudent33 与使用where 的方式完全相同,如Dusch's answer 所示。根据where's documentation,where(x) 等价于asarray(x).nonzero()【参考方案2】:

np.argwhere

import numpy as np
arr = np.array([[1,2,3], [0, 1, 0], [7, 0, 2]])
np.argwhere(arr == 0)

将所有找到的索引作为行返回:

array([[1, 0],    # Indices of the first zero
       [1, 2],    # Indices of the second zero
       [2, 1]],   # Indices of the third zero
      dtype=int64)

【讨论】:

【参考方案3】:

您可以搜索任何标量条件:

>>> a = np.asarray([0,1,2,3,4])
>>> a == 0 # or whatver
array([ True, False, False, False, False], dtype=bool)

这会将数组作为条件的布尔掩码返回。

【讨论】:

您可以使用它来访问零元素:a[a==0] = epsilon【参考方案4】:

您也可以在条件的布尔掩码上使用nonzero(),因为False 也是一种零。

>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])

>>> x==0
array([False, True, False, True, False, True, False, False, False, False, False], dtype=bool)

>>> numpy.nonzero(x==0)[0]
array([1, 3, 5])

mtrw的方式完全一样,但是和问题更相关;)

【讨论】:

这应该是公认的答案,因为这是建议使用nonzero 方法来检查条件。【参考方案5】:

您可以使用 numpy.nonzero 找到零。

>>> import numpy as np
>>> x = np.array([1,0,2,0,3,0,0,4,0,5,0,6]).reshape(4, 3)
>>> np.nonzero(x==0)  # this is what you want
(array([0, 1, 1, 2, 2, 3]), array([1, 0, 2, 0, 2, 1]))
>>> np.nonzero(x)
(array([0, 0, 1, 2, 3, 3]), array([0, 2, 1, 1, 0, 2]))

【讨论】:

【参考方案6】:

如果您使用的是一维数组,则存在语法糖:

>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])
>>> numpy.flatnonzero(x == 0)
array([1, 3, 5])

【讨论】:

只要我只有一个条件,它就可以正常工作。如果我想搜索“x == numpy.array(0,2,7)”怎么办?结果应该是数组([1,2,3,5,9])。但是我怎样才能得到这个? 你可以这样做:numpy.flatnonzero(numpy.logical_or(numpy.logical_or(x==0, x==2), x==7))【参考方案7】:

我会这样做:

>>> x = np.array([[1,0,0], [0,2,0], [1,1,0]])
>>> x
array([[1, 0, 0],
       [0, 2, 0],
       [1, 1, 0]])
>>> np.nonzero(x)
(array([0, 1, 2, 2]), array([0, 1, 0, 1]))

# if you want it in coordinates
>>> x[np.nonzero(x)]
array([1, 2, 1, 1])
>>> np.transpose(np.nonzero(x))
array([[0, 0],
       [1, 1],
       [2, 0],
       [2, 1])

【讨论】:

【参考方案8】:
import numpy as np

x = np.array([1,0,2,3,6])
non_zero_arr = np.extract(x>0,x)

min_index = np.amin(non_zero_arr)
min_value = np.argmin(non_zero_arr)

【讨论】:

【参考方案9】:
import numpy as np
arr = np.arange(10000)
arr[8000:8900] = 0

%timeit np.where(arr == 0)[0]
%timeit np.argwhere(arr == 0)
%timeit np.nonzero(arr==0)[0]
%timeit np.flatnonzero(arr==0)
%timeit np.amin(np.extract(arr != 0, arr))
23.4 µs ± 1.5 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
34.5 µs ± 680 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
23.2 µs ± 447 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
27 µs ± 506 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
109 µs ± 669 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

【讨论】:

以上是关于在 NumPy 数组中查找等于零的元素的索引的主要内容,如果未能解决你的问题,请参考以下文章

使用花哨的索引从 Numpy 数组中查找和删除全零列

如何从 NumPy 数组中删除所有零元素?

如何使用numpy查找数组中元素的索引? [复制]

如何在 numpy 数组上定义一个使用数组索引查找字典的函数?

诚之和:Numpy怎么检查数组全为零的几种方法

numpy如何查找数组中个数最多的元素