python - 如何构建有效的 K-means 算法?
问题描述
我写了一个简单的 K-mean 算法,但我发现很难逐个集群地探索它。
Github 链接:https ://github.com/AkshayBayas/Machine-learning-/blob/master/K-Means%20algorithm.ipynb
代码:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
%pylab
Df = pd.read_csv('Kdata.csv')
from sklearn.cluster import KMeans
KModule = KMeans()
K_model = KModule.fit(Df)
K_result = K_model.predict(Df)
centers = K_model.cluster_centers_
K_model.labels_
plt.scatter (x1,x2, c = K_model.labels_, cmap = 'rainbow' )
任何人都可以帮忙吗?
解决方案
不知道“按集群探索集群”是什么意思。
如果你不指定簇的数量,默认是8个,所以如果你像下面的代码一样从3开始,你可以将它们分开。您还需要将其设置为分类,集群,因此它不会在连续范围内着色:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
Df = pd.read_csv('Kdata.csv')
from sklearn.cluster import KMeans
KModule = KMeans(n_clusters=3)
K_model = KModule.fit(Df)
K_result = K_model.predict(Df)
Df['cluster'] = pd.Categorical(K_model.labels_)
sns.scatterplot("V1","V2",data=Df,hue='cluster',cmap = 'rainbow' )
Df.plot.scatter("V1","V2",c='cluster',cmap = 'rainbow')
推荐阅读
- c# - 拒绝访问 Web 应用程序
- php - .htaccess 重定向类似的 URL (404)
- sql-server - 如何衡量用户在 Azure sql server 数据库中使用的数据?
- excel - 当自定义不起作用时,如何在 Excel 中重命名加载项的选项卡?
- laravel - guzzlehttp 无法解析主机
- php - 如何在 wordpress 子菜单中检索自定义链接?
- html - 将边距底部添加到边框折叠表
- android - 删除列表中长单击侦听器上的项目
- javascript - 如何将格式正确的 Javascript 对象(字符串格式)转换为对象?
- php - Laravel 5.0 表单验证每个关系唯一