numpy dot() 和 inner() 之间的区别
Posted
技术标签:
【中文标题】numpy dot() 和 inner() 之间的区别【英文标题】:difference between numpy dot() and inner() 【发布时间】:2012-06-17 12:20:30 【问题描述】:有什么区别
import numpy as np
np.dot(a,b)
和
import numpy as np
np.inner(a,b)
我尝试的所有示例都返回了相同的结果。 Wikipedia 两者都有同一篇文章?!在inner()
的the description 中,它说它的行为在更高维度上是不同的,但我无法产生任何不同的输出。我应该使用哪一个?
【问题讨论】:
【参考方案1】:numpy.dot
:
对于二维数组,它相当于矩阵乘法,对于一维数组,它相当于向量的内积(没有复共轭)。对于 N 维,它是 a 的 最后一个轴 和 b 的 倒数第二个 的和积:
numpy.inner
:
一维数组向量的普通内积(没有复共轭),在更高维度上是最后一个轴的和积。
(强调我的。)
作为一个例子,考虑这个带有二维数组的例子:
>>> a=np.array([[1,2],[3,4]])
>>> b=np.array([[11,12],[13,14]])
>>> np.dot(a,b)
array([[37, 40],
[85, 92]])
>>> np.inner(a,b)
array([[35, 41],
[81, 95]])
因此,您应该使用的那个是为您的应用程序提供正确行为的那个。
性能测试
(请注意,我只测试一维情况,因为这是.dot
和.inner
给出相同结果的唯一情况。)
>>> import timeit
>>> setup = 'import numpy as np; a=np.random.random(1000); b = np.random.random(1000)'
>>> [timeit.timeit('np.dot(a,b)',setup,number=1000000) for _ in range(3)]
[2.6920320987701416, 2.676928997039795, 2.633111000061035]
>>> [timeit.timeit('np.inner(a,b)',setup,number=1000000) for _ in range(3)]
[2.588860034942627, 2.5845699310302734, 2.6556360721588135]
所以也许.inner
更快,但我的机器目前负载相当大,所以时间不一致,也不一定非常准确。
【讨论】:
@MillaWell,即使对于 2D 数组,它们也是不同的:它们仅在 1D 中是相同的。我不知道任何性能差异,有两种测试方法:reading the source(不容易)或使用timeit
进行一些分析(更容易)。
我想总的来说我什么都懂。例如,在您的示例中,您将 .dot
的第一个值计算为 (1*11+2*13)。您将如何计算示例中.inner
的第一个值?
@MillaWell,你是对的。让c = np.dot(a,b)
和d = np.inner(a,b)
然后c[i,j] == sum(a[i,:] * b[:,j])
和d[i,j] == sum(a[i,:] * b[j,:])
。
表达差异的另一种方式是说它们对于向量是相同的,但对于二维数组,np.dot(a, b) == np.inner(a, b.T)
和 np.dot(a, b.T) == np.inner(a, b)
。【参考方案2】:
np.dot
和 np.inner
对于一维数组是相同的,所以这可能就是您没有注意到任何差异的原因。对于 N 维数组,它们对应于常见的张量运算。
np.inner
有时被称为高阶和低阶张量之间的“向量积”,特别是张量乘以向量,并经常导致“张量收缩”。它包括矩阵向量乘法。
np.dot
对应于“张量积”,包括***页面底部提到的情况。它通常用于将两个相似的张量相乘以产生一个新的张量。它包括矩阵-矩阵乘法。
如果您不使用张量,则无需担心这些情况,它们的行为相同。
【讨论】:
看起来np.dot
现在(即在 Python 3 中)无论维度如何都是矩阵乘法。因此,即使对于一维数组,它也不同于 np.inner
。
我在 NumPy 1.13.3 和 Python 3.6.3 中看到了相同的结果。你用的是什么版本?举个例子也不错。【参考方案3】:
inner 无法正常处理复杂的二维数组,请尝试相乘
及其转置
array([[ 1.+1.j, 4.+4.j, 7.+7.j],
[ 2.+2.j, 5.+5.j, 8.+8.j],
[ 3.+3.j, 6.+6.j, 9.+9.j]])
你会得到
array([[ 0. +60.j, 0. +72.j, 0. +84.j],
[ 0.+132.j, 0.+162.j, 0.+192.j],
[ 0.+204.j, 0.+252.j, 0.+300.j]])
有效地将行乘以行,而不是行乘以列
【讨论】:
【参考方案4】:对于 1 维和 2 维数组,numpy.inner 用作转置第二个矩阵然后相乘。 所以对于:
A = [[a1,b1],[c1,d1]]
B = [[a2,b2],[c2,d2]]
numpy.inner(A,B)
array([[a1*a2 + b1*b2, a1*c2 + b1*d2],
[c1*a2 + d1*b2, c1*c2 + d1*d2])
我使用以下示例解决了这个问题:
A=[[1 ,10], [100,1000]]
B=[[1,2], [3,4]]
numpy.inner(A,B)
array([[ 21, 43],
[2100, 4300]])
这也解释了一维的行为,numpy.inner([a,b],[c,b]) = ac+bd
和 numpy.inner([[a],[b]], [[c],[d]]) = [[ac,ad],[bc,bd]]
。
这是我的知识范围,不知道它对更高维度有什么作用。
【讨论】:
【参考方案5】:在高维空间中,内积和点积有很大的不同。下面是 2x2 矩阵和 3x2 矩阵的示例 x = [[a1,b1],[c1,d1]] y= [[a2,b2].[c2,d2],[e2,f2]
np.inner(x,y)
输出 = [[a1xa2+b1xb2 ,a1xc2+b1xd2, a1xe2+b1f2],[c1xa2+d1xb2, c1xc2+d1xd2, c1xe2+d1xf2]]
但在点积的情况下,输出显示以下错误,因为您不能将 2x2 矩阵与 3x2 相乘。
ValueError:形状 (2,2) 和 (3,2) 未对齐:2 (dim 1) != 3 (dim 0)
【讨论】:
【参考方案6】:我编写了一个快速脚本来练习内积和点积数学。它真的帮助我感受到了不同之处:
你可以在这里找到代码:
https://github.com/geofflangenderfer/practice_inner_dot
【讨论】:
对否决票有什么解释吗?这帮助了我,我认为它也会帮助其他人。 您能否在答案中包含基本代码。以上是关于numpy dot() 和 inner() 之间的区别的主要内容,如果未能解决你的问题,请参考以下文章
Numpy数据的操作 * dot() multiply() 的区别
numpy使用np.dot函数或者@操作符计算两个numpy数组的点积数量积(dot productscalar product)