r - 有没有办法确定用于 R 聚类的不同属性的权重?
问题描述
我正在使用大约 70 个属性来使用 K-means 和分层技术创建集群(可能最终使用混合的分层 K-means 聚类技术)。有没有办法找出 70 个属性中的哪些属性对最终集群的权重更大?或者在确定最终集群时哪些属性似乎更重要/更重要?我在 R 中运行它。谢谢!
解决方案
您可以使用FeatureImpCluster:
library(FeatureImpCluster)
library(clustMixType)
data <- as.data.table(iris)
res <- kproto(x=data,k=4)
FeatureImp_res <- FeatureImpCluster(res,data)
plot(FeatureImp_res,data,color="type")