python - K 表示 Python 中的聚类 - 使用 make_blobs
问题描述
我试图弄清楚这个 make_blobs 函数中的 n_features 是什么。我目前正在使用 make_blob 为 ak 制作一些人工数据,这意味着在 Python 中进行聚类练习。
from sklearn.datasets import make_blobs
data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)
它的默认值为 2,它被描述为特征的数量。但是有人可以向我解释上面显示的这个例子吗?我认为它是 200 个样本,具有 2 个特征(x 和 ay 坐标),并且有 4 个中心,聚类标准差为 1.8。
如果我们将 n_features 更改为 23 会发生什么?这个剧情有变化吗?改变它会产生影响吗,只是因为我不确定它到底做了什么。谢谢你。
解决方案
如果你只从函数中解包单个值,就像你在这里做的那样:
data = make_blobs(n_samples = 200, n_features = 2, centers = 4, cluster_std = 1.8, random_state=101)
数据将是形状为 [n_samples, n_features] 的数组。因此,基本上当您将其更改为 23 时,您将获得形状为 [n_samples, 23] 的数组。您可以将生成的样本视为多维平面中的坐标。
推荐阅读
- zig - Slice 在 zig 语言中引用超出范围的数据
- flutter - 如何在颤动中将音频字节转换为字符串
- python - 使用 Python 计算云的预计到达时间 (ETA)?
- c# - 使用 entityframework 到 postgresql 运行 linq 查询期间超时
- c# - 如果测试失败,C#/Selenium 重试
- c# - 反序列化存在于不同位置的 xml 配置文件
- wordpress - 在 wp_nav_walker 菜单 WordPress 中显示菜单标签两次
- .net - 是否可以在 Azure 通信服务中的聊天与同一组中发起呼叫
- visual-studio-code - 脚本在 jupyter notebook 中运行,但不在 vscode 中
- database - 如何在 Postgres 中将所有没有模式的数据从一个数据库复制到另一个数据库?