在 NumPy 数组中查找等于零的元素的索引
Posted
技术标签:
【中文标题】在 NumPy 数组中查找等于零的元素的索引【英文标题】:Find indices of elements equal to zero in a NumPy array 【发布时间】:2011-06-03 02:00:11 【问题描述】:NumPy 具有有效的函数/方法nonzero()
来识别ndarray
对象中非零元素的索引。获取 值为 0 的元素的索引的最有效方法是什么?
【问题讨论】:
【参考方案1】:numpy.where() 是我的最爱。
>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])
>>> numpy.where(x == 0)[0]
array([1, 3, 5])
【讨论】:
我正在努力记住 Python。为什么where()
返回一个元组? numpy.where(x == 0)[1]
越界。那么索引数组与什么耦合呢?
@Zhubarb - 索引的大多数用途是元组 - np.zeros((3,))
例如制作一个 3 长的向量。我怀疑这是为了使解析参数变得容易。否则像 np.zeros(3,0,dtype='int16')
和 np.zeros(3,3,3,dtype='int16')
这样的东西会很烦人。
没有。 where
返回一个 ndarray
s 的元组,每个元组对应于输入的一个维度。在这种情况下,输入是一个数组,所以输出是1-tuple
。如果 x 是一个矩阵,它将是一个2-tuple
,以此类推
从 numpy 1.16 开始,documentation for numpy.where
特别推荐直接使用numpy.nonzero
,而不是只使用一个参数调用where
。
@mLstudent33 与使用where
的方式完全相同,如Dusch's answer 所示。根据where
's documentation,where(x)
等价于asarray(x).nonzero()
。【参考方案2】:
有np.argwhere
,
import numpy as np
arr = np.array([[1,2,3], [0, 1, 0], [7, 0, 2]])
np.argwhere(arr == 0)
将所有找到的索引作为行返回:
array([[1, 0], # Indices of the first zero
[1, 2], # Indices of the second zero
[2, 1]], # Indices of the third zero
dtype=int64)
【讨论】:
【参考方案3】:您可以搜索任何标量条件:
>>> a = np.asarray([0,1,2,3,4])
>>> a == 0 # or whatver
array([ True, False, False, False, False], dtype=bool)
这会将数组作为条件的布尔掩码返回。
【讨论】:
您可以使用它来访问零元素:a[a==0] = epsilon
【参考方案4】:
您也可以在条件的布尔掩码上使用nonzero()
,因为False
也是一种零。
>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])
>>> x==0
array([False, True, False, True, False, True, False, False, False, False, False], dtype=bool)
>>> numpy.nonzero(x==0)[0]
array([1, 3, 5])
和mtrw
的方式完全一样,但是和问题更相关;)
【讨论】:
这应该是公认的答案,因为这是建议使用nonzero
方法来检查条件。【参考方案5】:
您可以使用 numpy.nonzero 找到零。
>>> import numpy as np
>>> x = np.array([1,0,2,0,3,0,0,4,0,5,0,6]).reshape(4, 3)
>>> np.nonzero(x==0) # this is what you want
(array([0, 1, 1, 2, 2, 3]), array([1, 0, 2, 0, 2, 1]))
>>> np.nonzero(x)
(array([0, 0, 1, 2, 3, 3]), array([0, 2, 1, 1, 0, 2]))
【讨论】:
【参考方案6】:如果您使用的是一维数组,则存在语法糖:
>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])
>>> numpy.flatnonzero(x == 0)
array([1, 3, 5])
【讨论】:
只要我只有一个条件,它就可以正常工作。如果我想搜索“x == numpy.array(0,2,7)”怎么办?结果应该是数组([1,2,3,5,9])。但是我怎样才能得到这个? 你可以这样做:numpy.flatnonzero(numpy.logical_or(numpy.logical_or(x==0, x==2), x==7))
【参考方案7】:
我会这样做:
>>> x = np.array([[1,0,0], [0,2,0], [1,1,0]])
>>> x
array([[1, 0, 0],
[0, 2, 0],
[1, 1, 0]])
>>> np.nonzero(x)
(array([0, 1, 2, 2]), array([0, 1, 0, 1]))
# if you want it in coordinates
>>> x[np.nonzero(x)]
array([1, 2, 1, 1])
>>> np.transpose(np.nonzero(x))
array([[0, 0],
[1, 1],
[2, 0],
[2, 1])
【讨论】:
【参考方案8】:import numpy as np
x = np.array([1,0,2,3,6])
non_zero_arr = np.extract(x>0,x)
min_index = np.amin(non_zero_arr)
min_value = np.argmin(non_zero_arr)
【讨论】:
【参考方案9】:import numpy as np
arr = np.arange(10000)
arr[8000:8900] = 0
%timeit np.where(arr == 0)[0]
%timeit np.argwhere(arr == 0)
%timeit np.nonzero(arr==0)[0]
%timeit np.flatnonzero(arr==0)
%timeit np.amin(np.extract(arr != 0, arr))
23.4 µs ± 1.5 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
34.5 µs ± 680 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
23.2 µs ± 447 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
27 µs ± 506 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
109 µs ± 669 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
【讨论】:
以上是关于在 NumPy 数组中查找等于零的元素的索引的主要内容,如果未能解决你的问题,请参考以下文章