如何使用Python将K均值中的彩色分组标签返回到数据集?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用Python将K均值中的彩色分组标签返回到数据集?相关的知识,希望对你有一定的参考价值。

我对措辞非常糟糕的问题表示歉意。我正在使用k均值算法对投资组合中的各种股票进行分组,并希望采用PyPlot图表中分配给每个数据点的任何颜色,然后使用Python代码将其返回给excel电子表格。我的最终目标是查看特定组合中有多少被标记为“黑色”或“红色”。是否可以编写代码来读取PyPlot图形,采用其名称和颜色方向,然后将其导出到Excel?

很抱歉,如果这个问题太具体,并且我没有任何可使用的代码。我是新来的,所以如果这个问题不属于这里,请告诉我!

罗斯

答案

您没有发布任何示例代码,所以我只向您展示一些通用示例代码。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
import seaborn as sns
import matplotlib.pyplot as plt


X = np.array([[5,3],
     [10,15],
     [15,12],
     [24,10],
     [30,45],
     [85,70],
     [71,80],
     [60,78],
     [55,52],
     [80,91],])

kmeans = KMeans(n_clusters=2)
kmeans.fit(X)

print(kmeans.cluster_centers_)
print(kmeans.labels_)

data = X
labels = kmeans.labels_


plt.subplots_adjust(bottom = 0.1)
plt.scatter(data[:, 0], data[:, 1], c=kmeans.labels_, cmap='rainbow') 

for label, x, y in zip(labels, data[:, 0], data[:, 1]):
    plt.annotate(
        label,
        xy=(x, y), xytext=(-20, 20),
        textcoords='offset points', ha='right', va='bottom',
        bbox=dict(boxstyle='round,pad=0.5', fc='yellow', alpha=0.5),
        arrowprops=dict(arrowstyle = '->', connectionstyle='arc3,rad=0'))

plt.show()

enter image description here

我将其留给您将结果导出到Excel。有很多方法可以做到这一点。谷歌这个话题,你应该很容易找到一些适合你的东西。

以上是关于如何使用Python将K均值中的彩色分组标签返回到数据集?的主要内容,如果未能解决你的问题,请参考以下文章

无监督学习——K-均值聚类算法对未标注数据分组

学习毫末智行数据标注怎么分组

使用 ggplot2 将平均值添加到 R 中的分组箱形图

机器学习——利用K-均值聚类算法对未标注数据分组

k均值和kmeans的区别

LeetCode 0813. 最大平均值和的分组