什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?相关的知识,希望对你有一定的参考价值。

什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?

什么是维度诅咒?

随着维数(或特征)个数的增加,任意两个样本或者实例之间的平均距离也会增加,换句话说,在高维空间中,实例往往位于空间的边缘。这导致了训练问题,因为在一个充满空白的空间中没有明显的簇/趋势,算法需要更多的数据才能进行有效的学习。

如何评估降维算法在当前任务数据集上的效果?

如果降维算法能够提供数据重构的功能:

通过度量数据重构损失,即原始数据集与使用特定降维算法压缩后重构的数据集之间的距离。当然重构的误差越大、降维算法的效能越差、反之

以上是关于什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?的主要内容,如果未能解决你的问题,请参考以下文章

通俗易懂的机器学习——维度的诅咒(深入浅出表述机器学习降维的数学概念与实践)

是否会导致过度拟合/维度诅咒

sklearn的PCA

机器学习算法之降维

Sklearn:如何在庞大的数据集上应用降维?

ML: 降维算法-概述