Python中的矩阵求幂

Posted

技术标签:

【中文标题】Python中的矩阵求幂【英文标题】:Matrix exponentiation in Python 【发布时间】:2016-05-30 21:37:07 【问题描述】:

我正在尝试在 Python 中对一个复杂的矩阵求幂,但遇到了一些麻烦。我正在使用scipy.linalg.expm 函数,当我尝试以下代码时出现了一个相当奇怪的错误消息:

import numpy as np
from scipy import linalg

hamiltonian = np.mat('[1,0,0,0;0,-1,0,0;0,0,-1,0;0,0,0,1]')

# This works
t_list = np.linspace(0,1,10)
unitary = [linalg.expm(-(1j)*t*hamiltonian) for t in t_list]

# This doesn't
t_list = np.linspace(0,10,100)
unitary = [linalg.expm(-(1j)*t*hamiltonian) for t in t_list]

第二个实验运行时的错误是:

This works!
Traceback (most recent call last):
  File "matrix_exp.py", line 11, in <module>
    unitary_t = [linalg.expm(-1*t*(1j)*hamiltonian) for t in t_list]
  File "/usr/lib/python2.7/dist-packages/scipy/linalg/matfuncs.py",     line 105, in expm
    return scipy.sparse.linalg.expm(A)
  File "/usr/lib/python2.7/dist- packages/scipy/sparse/linalg/matfuncs.py", line 344, in expm
    X = _fragment_2_1(X, A, s)
  File "/usr/lib/python2.7/dist-  packages/scipy/sparse/linalg/matfuncs.py", line 462, in _fragment_2_1
    X[k, k] = exp_diag[k]
TypeError: only length-1 arrays can be converted to Python scalars

这看起来很奇怪,因为我改变的只是我使用的t 的范围。是因为哈密顿量是对角线的吗?一般来说,哈密顿量不会,但我也希望它适用于对角线。我真的不知道expm 的机制,所以任何帮助将不胜感激。

【问题讨论】:

您可以尝试将计算移至 for 循环而不是列表理解。然后你至少可以弄清楚它失败的 t 值。 程序失败的第一个数字是t=2.12121212121。这似乎完全是任意的......该程序不适用于t=2.ax,其中a &gt; 0。而且它根本不适用于t=3.x ... 【参考方案1】:

这很有趣。我可以说的一件事是问题是特定于np.matrix 子类的。例如,以下工作正常:

h = np.array(hamiltonian)
unitary = [linalg.expm(-(1j)*t*h) for t in t_list]

深入挖掘回溯,在_fragment_2_1 中的scipy.sparse.linalg.matfuncs.py 中引发了异常,特别是these lines:

n = X.shape[0]
diag_T = T.diagonal().copy()

# Replace diag(X) by exp(2^-s diag(T)).
scale = 2 ** -s
exp_diag = np.exp(scale * diag_T)
for k in range(n):
    X[k, k] = exp_diag[k]

错误信息

    X[k, k] = exp_diag[k]
TypeError: only length-1 arrays can be converted to Python scalars

向我建议 exp_diag[k] 应该是一个标量,而是返回一个向量(并且您不能将向量分配给 X[k, k],它是一个标量)。

设置断点并检查这些变量的形状证实了这一点:

ipdb> l
    751     # Replace diag(X) by exp(2^-s diag(T)).
    752     scale = 2 ** -s
    753     exp_diag = np.exp(scale * diag_T)
    754     for k in range(n):
    755         import ipdb; ipdb.set_trace()  # breakpoint e86ebbd4 //
--> 756         X[k, k] = exp_diag[k]
    757 
    758     for i in range(s-1, -1, -1):
    759         X = X.dot(X)
    760 
    761         # Replace diag(X) by exp(2^-i diag(T)).

ipdb> exp_diag.shape
(1, 4)
ipdb> exp_diag[k].shape
(1, 4)
ipdb> X[k, k].shape
()

根本问题是exp_diag 被假定为一维向量或列向量,但np.matrix 对象的对角线是行向量。这突出了一个更普遍的观点,即np.matrix 通常不如np.ndarray 得到很好的支持,因此在大多数情况下最好使用后者。

一种可能的解决方案是使用np.ravel()diag_T 扁平化为一维np.ndarray

diag_T = np.ravel(T.diagonal().copy())

这似乎解决了您遇到的问题,尽管我还没有发现与np.matrix 相关的其他问题。


我已经打开了一个拉取请求here。

【讨论】:

非常感谢您!我想我可能只使用ndarray 而不是mat 并在需要时将其转换回矩阵。我想我对这两个类的内部运作了解不够。不相关,但是如何在 Python 中设置断点?您使用的是特定的 IDE 还是可以在 emacs 等中使用? 您不需要 IDE 来设置断点。我使用的是ipdb,但您也可以使用标准的Python 调试器pdb。我使用 SublimeText3 作为编辑器,它有一个扩展来方便地设置断点,但肯定有一个 Emacs 等价物......

以上是关于Python中的矩阵求幂的主要内容,如果未能解决你的问题,请参考以下文章

矩阵快速幂

矩阵快速求幂

矩阵快速求幂

矩阵快速幂

使用矩阵求幂的线性递归[关闭]

矩阵求幂