首页 > 解决方案 > K 表示 Python 中的聚类 - 使用 make_blobs

问题描述

我试图弄清楚这个 make_blobs 函数中的 n_features 是什么。我目前正在使用 make_blob 为 ak 制作一些人工数据,这意味着在 Python 中进行聚类练习。

from sklearn.datasets import make_blobs
data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)

它的默认值为 2,它被描述为特征的数量。但是有人可以向我解释上面显示的这个例子吗?我认为它是 200 个样本,具有 2 个特征(x 和 ay 坐标),并且有 4 个中心,聚类标准差为 1.8。

如果我们将 n_features 更改为 23 会发生什么?这个剧情有变化吗?改变它会产生影响吗,只是因为我不确定它到底做了什么。谢谢你。

标签: pythonscikit-learncluster-analysisk-means

解决方案


如果你只从函数中解包单个值,就像你在这里做的那样:

data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)

数据将是形状为 [n_samples, n_features] 的数组。因此,基本上当您将其更改为 23 时,您将获得形状为 [n_samples, 23] 的数组。您可以将生成的样本视为多维平面中的坐标。


推荐阅读