数据流kmeans的matlab代码

Posted

技术标签:

【中文标题】数据流kmeans的matlab代码【英文标题】:matlab code for data streaming kmeans 【发布时间】:2012-07-30 20:42:28 【问题描述】:

我想拥有stream kmeans的能力,这意味着在对一组数据进行聚类后,我想向一个集群添加额外的数据或创建新的集群,而这一切都无需遍历旧数据。

我做了很多搜索,但无法找到这段代码的 matlab 实现,但是有很多 C 源代码。有人知道这样的事情吗?

【问题讨论】:

我会第一个问 - 你尝试了什么,你面临的问题是什么? @我没有什么可以尝试的,唯一的蛮力方法是我通过解释研究论文来编写实现。能够在 matlab 中流式传输 kmeans 是我的问题,因为我目前每次有新数据时都必须重做 kmeans 聚类。 【参考方案1】:

你可以使用kmeans的'start'参数。

矩阵:质心起始位置的 k×p 矩阵。在这种情况下, 你可以传入[] for k,kmeans从第一维推断出k 的矩阵。您还可以提供一个 3-D 数组,表示为 数组第三维度的 'replicates' 参数。

【讨论】:

这和数据流一样吗?所以看起来的情况是我可以把前一次迭代的kmeans结果放在这里。我会尝试一下,但我想知道考虑到所有关于此的最新研究论文是否真的会这么容易。 我不知道。我从来没有流式传输 kmeans... 出于好奇,您是否有一个好文章的链接,该链接解释了如何流式传输 kmeans,以防我有时间浏览?

以上是关于数据流kmeans的matlab代码的主要内容,如果未能解决你的问题,请参考以下文章

求MATLAB实现canopy-kmeans聚类算法的完整代码

数学建模MATLAB应用实战系列(108)-K-medoids聚类(附MATLAB代码)

聚类算法及Matlab实现

[matlab] 18.matlab自带kmeans函数的求点集的重心

matlab下kmeans及pam算法对球型数据分类练习

matlab如何求kmean聚类中心点的坐标和各个中心包含的样本点数,要用到那些命令