无监督学习
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了无监督学习相关的知识,希望对你有一定的参考价值。
我正在研究最后一年的项目,该项目必须使用无监督学习(KMeans算法)进行编码。它是从各种游戏中预测关于其认知技能水平的合适游戏。技能是专注,响应时间,记忆和注意力。
第一个问题是我找不到包含技能和游戏的正确数据集。然后我不确定如何找出集群。有没有可能找到合适的数据集以及如何对它们进行聚类的方法?
此外,如何在没有数据集的情况下进行此操作(不使用强化学习)?
提前致谢
首先,我对你的问题感到困惑。但我会尽力回答我的能力。 K均值聚类是一种基于彼此数据的距离(通常为欧几里得)的无监督聚类方法。具有相似特征的数据点将具有更近的距离,然后将聚集到同一群集中。
我假设您正在尝试构建一个输出推荐游戏的算法,给出个人集中度,响应时间,记忆力和注意力技能。
第一个问题是我找不到包含技能和游戏的正确数据集。
对于数据集,您可以按字面意思构建自己的数据集,如下所示:
labels = [游戏]
特征= [浓度,响应时间,记忆,注意]
标签是一个n乘1的向量,其中n是游戏的数量。特征是一个n乘4的向量,每个技能的范围可以是1 - 5,5是最高的。然后用你最喜欢的经典游戏填充它。
例如,俄罗斯方块可以是您的第一个游戏,并将其添加到您的数据集中,如下所示:
label = [俄罗斯方块]
特征= [5,2,1,4]
在俄罗斯方块你需要大量的注意力和注意力,但你不需要很好的响应时间,因为块很慢而且你不需要记住任何东西。
然后我不确定如何找出集群。
您首先必须确定要使用的距离,例如曼哈顿,欧几里德等。然后你需要决定集群的数量。 k-means算法非常简单,只需观看以下视频即可学习:https://www.youtube.com/watch?v=_aWzGGNrcic
此外,如何在没有数据集的情况下进行此操作(不使用强化学习)?
这个问题有道理,因为首先,如果你没有数据,你怎么能将它们聚类?想象一下,你的朋友要求你把所有青苹果和红苹果分开。但他们从来没有给你任何苹果......你怎么能把它们聚集起来呢?是不可能的。
其次,在这种情况下,我不确定强化学习是什么意思。强化学习是关于环境中存在的代理,并学习如何在这种环境中最佳地表现以最大化其内部奖励。例如,一个人进入赌场并试图赚到最多钱。它与数据集无关。
以上是关于无监督学习的主要内容,如果未能解决你的问题,请参考以下文章