如何使用二维直方图/频率图在 R 中绘制二进制聚类数据
Posted
技术标签:
【中文标题】如何使用二维直方图/频率图在 R 中绘制二进制聚类数据【英文标题】:How to graph binary clustered data in R using a two-dimensional histogram/frequency chart 【发布时间】:2020-03-12 03:19:51 【问题描述】:我正在使用 R 来绘制聚集的二进制数据。数据如下所示: Table of data. 我的目标是按以下方式绘制数据:
我尝试使用 fviz_cluster,但无法让 R 理解,图实际上只有两个维度(A;B),并且这两个维度各有三个子类别(A_1、A_2、A_3; B_1、B_2、B3)。 非常感谢您提供任何有用的建议!
【问题讨论】:
嗨 wtgw,尽量不要粘贴图像。如果您可以发布您的数据示例和您尝试过的代码,这将对我们和您有所帮助。 还有。您对 A 的编码看起来像一组指标变量(例如 red=A1、blue=A2、green=A3),因为每一行只有一列的值为 1。但是B不一样。行在 2 甚至所有 3 个类别上有 1。您的数据有超过 2 个维度。 我不知道“集群”是否是在这里使用的正确术语。恕我直言,如果您搜索该术语,您只会找到所有“错误”的工具。这可能就是 fviz_cluster 不适合您的原因。 【参考方案1】:尝试应用“树分类器”,例如 J48(又名 C45),然后可视化决策边界。
在 Weka 中它看起来像这样:
这里我使用了 Iris 数据集,然后为 x 和 y 坐标选择了 2 个数字属性。在我的例子中,有一个属性“类”(=花名)可以从叶子宽度中预测出来,并且在这里用颜色编码。我不确定你的数据集中是否有这样的属性。
如果你不这样做:你的数据集让我想起了我在这里无法解决的离散优化问题(背包问题)。
【讨论】:
以上是关于如何使用二维直方图/频率图在 R 中绘制二进制聚类数据的主要内容,如果未能解决你的问题,请参考以下文章