Python中的矩阵求幂
Posted
技术标签:
【中文标题】Python中的矩阵求幂【英文标题】:Matrix exponentiation in Python 【发布时间】:2016-05-30 21:37:07 【问题描述】:我正在尝试在 Python 中对一个复杂的矩阵求幂,但遇到了一些麻烦。我正在使用scipy.linalg.expm
函数,当我尝试以下代码时出现了一个相当奇怪的错误消息:
import numpy as np
from scipy import linalg
hamiltonian = np.mat('[1,0,0,0;0,-1,0,0;0,0,-1,0;0,0,0,1]')
# This works
t_list = np.linspace(0,1,10)
unitary = [linalg.expm(-(1j)*t*hamiltonian) for t in t_list]
# This doesn't
t_list = np.linspace(0,10,100)
unitary = [linalg.expm(-(1j)*t*hamiltonian) for t in t_list]
第二个实验运行时的错误是:
This works!
Traceback (most recent call last):
File "matrix_exp.py", line 11, in <module>
unitary_t = [linalg.expm(-1*t*(1j)*hamiltonian) for t in t_list]
File "/usr/lib/python2.7/dist-packages/scipy/linalg/matfuncs.py", line 105, in expm
return scipy.sparse.linalg.expm(A)
File "/usr/lib/python2.7/dist- packages/scipy/sparse/linalg/matfuncs.py", line 344, in expm
X = _fragment_2_1(X, A, s)
File "/usr/lib/python2.7/dist- packages/scipy/sparse/linalg/matfuncs.py", line 462, in _fragment_2_1
X[k, k] = exp_diag[k]
TypeError: only length-1 arrays can be converted to Python scalars
这看起来很奇怪,因为我改变的只是我使用的t
的范围。是因为哈密顿量是对角线的吗?一般来说,哈密顿量不会,但我也希望它适用于对角线。我真的不知道expm
的机制,所以任何帮助将不胜感激。
【问题讨论】:
您可以尝试将计算移至 for 循环而不是列表理解。然后你至少可以弄清楚它失败的 t 值。 程序失败的第一个数字是t=2.12121212121
。这似乎完全是任意的......该程序不适用于t=2.ax
,其中a > 0
。而且它根本不适用于t=3.x
...
【参考方案1】:
这很有趣。我可以说的一件事是问题是特定于np.matrix
子类的。例如,以下工作正常:
h = np.array(hamiltonian)
unitary = [linalg.expm(-(1j)*t*h) for t in t_list]
深入挖掘回溯,在_fragment_2_1
中的scipy.sparse.linalg.matfuncs.py
中引发了异常,特别是these lines:
n = X.shape[0]
diag_T = T.diagonal().copy()
# Replace diag(X) by exp(2^-s diag(T)).
scale = 2 ** -s
exp_diag = np.exp(scale * diag_T)
for k in range(n):
X[k, k] = exp_diag[k]
错误信息
X[k, k] = exp_diag[k]
TypeError: only length-1 arrays can be converted to Python scalars
向我建议 exp_diag[k]
应该是一个标量,而是返回一个向量(并且您不能将向量分配给 X[k, k]
,它是一个标量)。
设置断点并检查这些变量的形状证实了这一点:
ipdb> l
751 # Replace diag(X) by exp(2^-s diag(T)).
752 scale = 2 ** -s
753 exp_diag = np.exp(scale * diag_T)
754 for k in range(n):
755 import ipdb; ipdb.set_trace() # breakpoint e86ebbd4 //
--> 756 X[k, k] = exp_diag[k]
757
758 for i in range(s-1, -1, -1):
759 X = X.dot(X)
760
761 # Replace diag(X) by exp(2^-i diag(T)).
ipdb> exp_diag.shape
(1, 4)
ipdb> exp_diag[k].shape
(1, 4)
ipdb> X[k, k].shape
()
根本问题是exp_diag
被假定为一维向量或列向量,但np.matrix
对象的对角线是行向量。这突出了一个更普遍的观点,即np.matrix
通常不如np.ndarray
得到很好的支持,因此在大多数情况下最好使用后者。
一种可能的解决方案是使用np.ravel()
将diag_T
扁平化为一维np.ndarray
:
diag_T = np.ravel(T.diagonal().copy())
这似乎解决了您遇到的问题,尽管我还没有发现与np.matrix
相关的其他问题。
我已经打开了一个拉取请求here。
【讨论】:
非常感谢您!我想我可能只使用ndarray
而不是mat
并在需要时将其转换回矩阵。我想我对这两个类的内部运作了解不够。不相关,但是如何在 Python 中设置断点?您使用的是特定的 IDE 还是可以在 emacs
等中使用?
您不需要 IDE 来设置断点。我使用的是ipdb
,但您也可以使用标准的Python 调试器pdb
。我使用 SublimeText3 作为编辑器,它有一个扩展来方便地设置断点,但肯定有一个 Emacs 等价物......以上是关于Python中的矩阵求幂的主要内容,如果未能解决你的问题,请参考以下文章