python-3.x - 解释 K-Means cluster_centers_ 输出
问题描述
我很难解释cluster_centers_
数组输出的结果。
考虑以下 MWE:
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
import numpy as np
# Load the data
iris = load_iris()
X, y = iris.data, iris.target
# shuffle the data
shuffle = np.random.permutation(np.arange(X.shape[0]))
X = X[shuffle]
# scale X
X = (X - X.mean()) / X.std()
# plot K-means centroids
km = KMeans(n_clusters = 2, n_init = 10) # establish the model
# fit the data
km.fit(X);
# km centers
km.cluster_centers_
array([[ 1.43706001, -0.29278015, 0.75703227, -0.89603057],
[ 0.78079175, -0.04797174, -0.96467783, -1.60799713]])
在上面的数组中,我不清楚如何使用这些值来识别集群中心。我告诉 K-Means 给我 2 个聚类,但它为我返回 8 个值,但它们不能是所有 4 个特征的 x、y 坐标。
如果我绘制1.43706001, -0.29278015
;这很直观,它是一个位于预测集群中间的集群。
因此,如果是这种情况,并且我的第二个集群是0.78079175, -0.04797174
,那么第 2 列和第 3 列中的值是什么?
解决方案
来自文档
cluster_centers_
:ndarray of shape (n_clusters, n_features)
iris 数据库有 4 个特征 ( X.shape = (150,4)
),您希望 Kmeans 在 4 维特征空间中获得两个质心。cluster_centers_
正是这样做的,列表的每个条目对应于 R^4 中质心的坐标。
推荐阅读
- python - 安装成功后无法导入Tensorflow
- pointers - 分配指针后如何将fortran指针值复制到数组
- angular - Angular 中的 SSR 构建显示多个错误
- docker - DOCKER BUILDKIT:在构建时使用现有的秘密
- reactjs - React Bootstrap Navbar 2 行
- java - 原因:java.lang.IllegalArgumentException:不支持的类文件主要版本 60
- sql - 如何对 SQL 表中 XML 列中的节点进行分组计数?
- ios - Swift - Vapor - 在请求参数中用 %2B 替换加号
- c# - 过渡到新场景后,Unity 动画不播放
- javascript - 渲染中的第二次返回没有被忽略 React