1.2：无监督学习导学

Posted 2021-03-12 nishida-rin

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了1.2：无监督学习导学相关的知识，希望对你有一定的参考价值。

无监督学习的目标：

利用无标签的数据学习数据的分部或数据与数据之间的关系被称作无监督学习。

技术图片 ?

技术图片

s:协方差矩阵

马氏距离：红黑>绿黑

欧氏距离：红黑<绿

技术图片

标准数据输入格式:[样本个数，特征个数]定义的矩阵形式。

相似性矩阵输入格式：即由[样本数目，样本数目]定义的矩阵形式，矩阵中

的每一个元素为两个样本的相似度，如DBSCAN， AffinityPropagation(近邻传

播算法)接受这种输入。如果以余弦相似度为例，则对角线元素全为1. 矩阵中每

个元素的取值范围为[0,1]

降维，就是在保证数据所具有的代表性特性或者分布的情况下，将高维数据转化为低维数据的过程。

目的：

聚类和降维都是无监督学习的典型任务，任务之间存在关联，比如某些高维数据的聚类可以通过降维处理更好的获得，另外学界研究也表明代表性的聚类算法如k-means与降维算法如NMF之间存在等价性。

降维是机器学习领域的一个重要研究内容，有很多被工业界和学术界接受的典型算法，截止到目前sklearn库提供7种降维算法。
降维过程也可以被理解为对数据集的组成成份进行分解（decomposition）的过程，因此sklearn为降维模块命名为decomposition, 在对降维算法调用需要使用sklearn.decomposition模块

以上是关于1.2：无监督学习导学的主要内容，如果未能解决你的问题，请参考以下文章