machine-learning - 聚类分析
问题描述
我们已经在具有 4 个特征的数据集上使用 k=3 集群进行了 KMeans 聚类,并用输入特征绘制了每个集群的质心坐标。我们希望专注于一个集群,并尝试找出相对于其他特征,哪个特征对特定集群的贡献更大。我们对其他集群也这样做。
例如,让我们假设我们有c1
c2
c3
具有特征f1
f2
f3
和的集群f4
。集群的质心例如
C1
C2
C3
分别具有相应的特征f1
f2
f3
f4
f1 f2 f3 f4
C1 -2.02746249 2.10961828 -0.57917217 1.687631
C2 0.63967987 -0.55768793 0.76387423 0.265274
C3 -0.38727624 0.18714381 -1.27291271 -1.273105
我们能否推断出对于集群 1,因为f2
(feature2) 的质心最高,因此可以将其视为该特定集群的最重要/贡献最大的特征,类似地,对于集群 2,f3
(feature3) 的质心最高,因此可以将其视为集群 2 的重要特征。
解决方案
推荐阅读
- c++ - 如何通过使用 void 传递变量中的信息
- r - 如何连接R中每3行以上的值
- javascript - Django + Service Workers:“重定向响应用于重定向模式不遵循的请求”错误
- java - 使用 jarfile 中不可用的 JSONParser 读取 JSON 文件
- regex - 在 python 3 regex 中打印有效日志文件条目的列表
- angular - 如何实现包含大量组件的 Angular 模板驱动表单?
- python - 忽略列表中的特殊字符,不包括提到的字符
- javascript - 尝试返回 givenName 的所有键值
- mysql - 在 sequelize 中使用 groupby 来获取分组项目的数组
- macos - 无法创建 DispatcherResourceManagerComponent