首页 > 解决方案 > 在数据框的两列之间绘制集群数据点

问题描述

我有一个数据框,其中两列是年龄和收入。我已经使用 Kmeans 对数据进行了聚类。现在我想在年龄和收入之间绘制,以区分基于集群的数据点(按颜色)

df

Age    Income    Cluster
20      10000     1
30      20000     2
40      25000     1
50      20000     2
60      10000     3
70      15000     3

.

plot(df$Age,df$Income)

我想绘制年龄和收入之间的数据点,并且每个数据点都应该根据集群着色

标签: r

解决方案


你可以用ggplot()这个:

ggplot() +
  geom_point(mapping = aes(x = Age, y = Income, color = Cluster))

这里是根据数据中的值创建美学(点的 x 位置基于年龄,y 位置基于收入,点的颜色基于变量“集群”)。

您也可以使用基础 R 添加它,这是使用 mtcars 数据集的示例...

plot(x = mtcars$wt, y = mtcars$mpg, col = mtcars$cyl)

推荐阅读