如何使用动态时间规整获得距离矩阵?

Posted

技术标签:

【中文标题】如何使用动态时间规整获得距离矩阵?【英文标题】:How to get distance matrix using dynamic time wraping? 【发布时间】:2020-09-24 09:47:24 【问题描述】:

我有 6 个时间序列值如下。

import numpy as np
series = np.array([
     [0., 0, 1, 2, 1, 0, 1, 0, 0],
     [0., 1, 2, 0, 0, 0, 0, 0, 0],
     [1., 2, 0, 0, 0, 0, 0, 1, 1],
     [0., 0, 1, 2, 1, 0, 1, 0, 0],
     [0., 1, 2, 0, 0, 0, 0, 0, 0],
     [1., 2, 0, 0, 0, 0, 0, 1, 1]])

假设,我想得到动态时间扭曲的距离矩阵来执行聚类。我使用了 dtaidistance 库,如下所示。

from dtaidistance import dtw
ds = dtw.distance_matrix_fast(series)

我得到的输出如下。

array([[       inf, 1.41421356, 2.23606798, 0.        , 1.41421356, 2.23606798],
       [       inf,        inf, 1.73205081, 1.41421356, 0.        , 1.73205081],
       [       inf,        inf,        inf, 2.23606798, 1.73205081, 0.        ],
       [       inf,        inf,        inf,        inf, 1.41421356, 2.23606798],
       [       inf,        inf,        inf,        inf,        inf, 1.73205081],
       [       inf,        inf,        inf,        inf,        inf,        inf]])

在我看来,我得到的输出是错误的。例如,据我了解,输出的对角线值应为 0(因为它们是理想匹配)。

我想知道我在哪里做错了以及如何解决它。我也很高兴使用其他 python 库得到答案。

如果需要,我很乐意提供更多详细信息

【问题讨论】:

【参考方案1】:

一切都是正确的。根据the docs:

结果以矩阵表示形式存储。 由于只有鞋面 需要三角矩阵这种表示使用更多的内存然后 必要的。

所有对角线元素均为 0,下三角矩阵与上三角矩阵在对角线上的镜像相同。由于所有这些值都可以从上三角矩阵中扣除,因此它们不会显示在输出中。 您甚至可以使用compact=True 参数仅从连接到一维数组的上对角矩阵中获取值。

您可以像这样将结果转换为完整的矩阵:

ds[ds==np.inf] = 0
ds += dt.T

【讨论】:

【参考方案2】:

dtw.py 中,距离矩阵元素的默认值被指定为np.inf。由于矩阵返回的是不同序列之间的成对距离,因此不会在矩阵中填充,导致np.inf值。

尝试使用dtw.distance_matrix_fast(series, compact=True) 运行以防止看到此填充信息。

【讨论】:

以上是关于如何使用动态时间规整获得距离矩阵?的主要内容,如果未能解决你的问题,请参考以下文章

在 Pandas 数据框中计算动态时间扭曲距离

视频时间序列分类方法:动态时间规整算法DTW和R语言实现|附代码数据

DTW (Dynamic Time Warping) 动态时间规整

时间序列~动态时间规整(Dynamic Time Wraping)

如何仅使用 numpy 从距离矩阵中提取数据点?

对 2 个距离矩阵求和以获得第三个“整体”距离矩阵(生态环境)