相异矩阵中具有缺失值的多维缩放

Posted

技术标签:

【中文标题】相异矩阵中具有缺失值的多维缩放【英文标题】:Multidimensional scaling with missing values in dissimilarity matrix 【发布时间】:2017-09-18 08:59:51 【问题描述】:

我有一个相异矩阵,我想使用 sklearn.manifold.MDS 函数在其上执行多维缩放 (MDS)。该矩阵中某些元素之间的差异没有意义,因此我想知道是否有办法在稀疏矩阵或缺失值的矩阵上运行 MDS? 根据this 问题,与 0 的差异被认为是缺失值,但我无法在官方文档中找到此声明。值 0 的差异不是解释为彼此非常接近的点吗?

欢迎任何关于如何基于稀疏相异矩阵获得我的高维数据集的低维表示的建议。谢谢!

【问题讨论】:

【参考方案1】:

感谢您对该问题的提示!我查看了代码: 要将非对角线上的零解释为缺失值,您需要使用由MDS(metric=False) 使用 SMACOF 算法的 MDS 的非度量版本。

我有同样的问题,直到现在我只看到在应用 MDS 之前在距离矩阵上执行 matrix completion 的替代方法。

【讨论】:

以上是关于相异矩阵中具有缺失值的多维缩放的主要内容,如果未能解决你的问题,请参考以下文章

pandas判断缺失值的办法

为啥要创建一个二进制列来指示具有缺失值的记录

用于异常检测的具有缺失值的时间序列的 STL 分解

添加缺失的报告日期,不包括具有指定值的周末

删除同一列或连续行的另一列中具有特定值和缺失值的行

Pandas:合并具有不同索引和缺失值的两个数据框