首页 > 解决方案 > 如何分析R中亲和传播聚类的图结果?

问题描述

我已经安装了R的亲和传播集群包并阅读了decommentation。对 iris 数据进行聚类的基本脚本是:

data(iris)
apIris1 <- apcluster(negDistMat(r=2), iris)
apIris1

使用此代码,形成了六个集群。此外,可以使用以下代码以图形方式查看结果:

plot(apIris1, iris)

生成的图如下:

在此处输入图像描述

关于该图的可用信息是:每种颜色对应一个簇。每个集群的样本由一个框标记,所有集群成员都用线连接到它们的样本。 还有其他方法可以分析这个情节吗?例如:每个包含六个簇的大框(包含彩色数据)有什么区别?它们之间的关系是什么?当我尝试仅用 绘制数据时plot(iris),生成的相同图没有颜色(黑点)且没有聚类。如何分析数据图?

此外,可以生成热图heatmap(apIris1),如下所示:

在此处输入图像描述

如上图所示,顶部和左侧的不同颜色描绘了集群的总数。我怎样才能详细分析这个情节

任何帮助,请!

对不起,冗长的帖子!

更新:

在此处输入图像描述

这里,由134连接的大框(不包括具有特征名称的框)分别具有相似的数据分布。但是,由2连接的盒子具有镜像分布。这种不同的数据分布真正说明了什么?如果只有一个大箱线图,那将很容易可视化。但是,具有不同数据分布/模式的框让我感到困惑。我们可以将每一行或每一列与它们各自的特征名称联系起来吗?

标签: rcluster-analysis

解决方案


你有四维数据。

图中的每个“大框”都对应于数据的二维视图,基于仅选择 2 个特征作为 x 和 y。

热图更适合层次聚类。您可以看到簇是一致的(白色),但也有一些不同的簇大多是白色的(蓝色和青色的交集),因此它们分离得不是很好。


推荐阅读