python - 标准化会改变聚类模型的结果吗?
问题描述
我有一个点 6147 的数据集,当数据被编码并传递给聚类模型时,它被聚类为 3049 和 3098 的 2 个聚类,但是当相同的数据集在编码后标准化时,聚类变化为 5951 和 196,具有不平衡的性质。编码后标准化后聚类数据的可视化
# Plot the clustered data
fig, ax = plt.subplots(figsize=(6, 6))
plt.scatter(X_std[km.labels_ == 0, 0], X_std[km.labels_ == 0, 1],
c='green', label='cluster 1')
plt.scatter(X_std[km.labels_ == 1, 0], X_std[km.labels_ == 1, 1],
c='blue', label='cluster 2')
plt.scatter(centroids[:, 0], centroids[:, 1], marker='*', s=300,
c='r', label='centroid')
plt.legend()
plt.xlim([-2, 2])
plt.ylim([-2, 2])
plt.xlabel('X axis')
plt.ylabel('Y axis')
plt.title('Visualization of clustered data', fontweight='bold')
ax.set_aspect('equal');
解决方案
推荐阅读
- batch-file - Check leap year
- html - 如何防止我的 CSS 动画使我的页面滚动?
- angular - HTTP Headers + Form Data from incoming POST request in Angular
- google-apps-script - 是否有可以在任何打开的电子表格中运行的 Google 表格宏?如果是这样,怎么做?
- javascript - 如何使用浏览器特征检测来控制视频属性静音?
- jquery - 带有 5 个步骤的 jQuery 步骤
- java - .stream().mapToInt(i -> i) 在 Java 中是什么意思?
- python - 列表理解中的条件嵌套循环
- c# - 如何让玩家顺利跟随 touch x 位置?
- recoiljs - 将类实例存储在反冲中