什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?
Posted Data+Science+Insight
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?相关的知识,希望对你有一定的参考价值。
什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?
什么是维度诅咒?
随着维数(或特征)个数的增加,任意两个样本或者实例之间的平均距离也会增加,换句话说,在高维空间中,实例往往位于空间的边缘。这导致了训练问题,因为在一个充满空白的空间中没有明显的簇/趋势,算法需要更多的数据才能进行有效的学习。
如何评估降维算法在当前任务数据集上的效果?
如果降维算法能够提供数据重构的功能:
通过度量数据重构损失,即原始数据集与使用特定降维算法压缩后重构的数据集之间的距离。当然重构的误差越大、降维算法的效能越差、反之
以上是关于什么是维度诅咒?如何评估降维算法在当前任务数据集上的效果?的主要内容,如果未能解决你的问题,请参考以下文章