python-3.x - 有人可以帮助将数组拟合到 kmeans 聚类中吗
问题描述
当我尝试将其放入 kmeans 聚类中时,它会引发错误“ValueError:设置带有序列的数组元素”。
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=5)
kmeans.fit(df)
数组说明。名称:向量,长度:179,数据类型:对象
0 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...
1 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...
10 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...
100 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...
101 [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...
解决方案
您的专栏中有一个列表。在将其传递给 KMeans 之前,需要将其打开为多个列。
df = pd.read_json('/Users/roshansk/Downloads/NewsArticles.json')
#Extracting the vectors into columns
vectors = df.Vector.apply(pd.Seriesies)
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=5)
kmeans.fit(vectors)
推荐阅读
- java - Hibernate 一对一注释行为怪异
- c# - 在 Unity 中检测碰撞并销毁游戏对象
- assembly - 主题:FCOMIP 没有返回一致的结果
- php - 为 PHP 应用程序设置默认时区
- c# - 在邮递员 chrome 中发布请求工作正常,但在本地邮递员中我不断收到 System.NullReferenceException
- mongodb - 为什么这种 MongooseDB 填充方法不起作用?
- php - laravel mail attach() 方法返回关于空参数的错误
- php - htaccess调度程序重写规则不起作用
- swift - 如何在 ViewController 中使用 tapHandler 将 tapGesture 添加到 UIView?
- python - 如何在 SymPy 中处理伽罗瓦域上的多项式