无监督算法

Posted 2021-02-07 abella

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了无监督算法相关的知识，希望对你有一定的参考价值。

无监督算法：

KMeans算法：

1、随机初始化数据集簇的中心，一般从数据集中选择

2、外循环：

内循环：计算各个数值点到中心的距离，进行聚类

计算每个聚类的平局值，移动聚类中心

技术图片

PCA算法：

目标：数据压缩和可视化

1、对样本数据进行去均值和归一化

2、组建sigma矩阵，然后进行奇异值分解，求的压缩和的结果Z

技术图片

异常检测算法：

1、选择可能适应于异常样本的特征

2、根据样本得到高斯分布的均值和方差

3、对给定的样本计算其是否为异常样本

技术图片

异常检测与监督学习：

异常检测：正样本数量较少（0-20）；大量的负样本

不同类型的正样本，很难从正样本中学的算法将其识别出来

未来会出现之前从未出现过的正样本，与当前的正样本无相似性

监督学习：有大量的正样本和负样本；

足够的样本支撑可以从中学到正样本的特征的检测算法

未来很难出现正样本中未出现过的样本

技术图片

常见的异常检测和监督学习：

异常检测：欺诈行为/制造业/数据中心的监测

监督学习：垃圾邮件/天气/癌症

技术图片

以上是关于无监督算法的主要内容，如果未能解决你的问题，请参考以下文章