首页 > 解决方案 > 有人可以帮助将数组拟合到 kmeans 聚类中吗

问题描述

当我尝试将其放入 kmeans 聚类中时,它会引发错误“ValueError:设置带有序列的数组元素”。

from sklearn.cluster import KMeans    
kmeans = KMeans(n_clusters=5)
kmeans.fit(df)

数组说明。名称:向量,长度:179,数据类型:对象

0 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...

1 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...

10 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...

100 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...

101 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...

标签: python-3.xpandasnumpymachine-learningk-means

解决方案


您的专栏中有一个列表。在将其传递给 KMeans 之前,需要将其打开为多个列。

df = pd.read_json('/Users/roshansk/Downloads/NewsArticles.json')

#Extracting the vectors into columns
vectors = df.Vector.apply(pd.Seriesies)

from sklearn.cluster import KMeans    
kmeans = KMeans(n_clusters=5)
kmeans.fit(vectors)



推荐阅读