r - 在数据框的两列之间绘制集群数据点
问题描述
我有一个数据框,其中两列是年龄和收入。我已经使用 Kmeans 对数据进行了聚类。现在我想在年龄和收入之间绘制,以区分基于集群的数据点(按颜色)
df
Age Income Cluster
20 10000 1
30 20000 2
40 25000 1
50 20000 2
60 10000 3
70 15000 3
.
plot(df$Age,df$Income)
我想绘制年龄和收入之间的数据点,并且每个数据点都应该根据集群着色
解决方案
你可以用ggplot()
这个:
ggplot() +
geom_point(mapping = aes(x = Age, y = Income, color = Cluster))
这里是根据数据中的值创建美学(点的 x 位置基于年龄,y 位置基于收入,点的颜色基于变量“集群”)。
您也可以使用基础 R 添加它,这是使用 mtcars 数据集的示例...
plot(x = mtcars$wt, y = mtcars$mpg, col = mtcars$cyl)