无监督算法
Posted abella
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了无监督算法相关的知识,希望对你有一定的参考价值。
无监督算法:
KMeans算法:
1、 随机初始化数据集簇的中心,一般从数据集中选择
2、 外循环:
内循环:计算各个数值点到中心的距离,进行聚类
计算每个聚类的平局值,移动聚类中心
PCA算法:
目标:数据压缩和可视化
1、 对样本数据进行去均值和归一化
2、 组建sigma矩阵,然后进行奇异值分解,求的压缩和的结果Z
异常检测算法:
1、 选择可能适应于异常样本的特征
2、 根据样本得到高斯分布的均值和方差
3、 对给定的样本计算其是否为异常样本
异常检测与监督学习:
异常检测:正样本数量较少(0-20);大量的负样本
不同类型的正样本,很难从正样本中学的算法将其识别出来
未来会出现之前从未出现过的正样本,与当前的正样本无相似性
监督学习:有大量的正样本和负样本;
足够的样本支撑可以从中学到正样本的特征的检测算法
未来很难出现正样本中未出现过的样本
常见的异常检测和监督学习:
异常检测:欺诈行为/制造业/数据中心的监测
监督学习:垃圾邮件/天气/癌症
以上是关于无监督算法的主要内容,如果未能解决你的问题,请参考以下文章