首页 > 解决方案 > kmeans结果上的Python DataFrame groupby不显示所有类别

问题描述

对于为什么会发生这种情况的任何反馈,我将不胜感激:

我有一个每小时速度数据集,其中包含许多道路的 24 列速度数据(一天 24 小时)(因此数据大小为 90000、24)。然后我对数据进行了 kmeans 分析,这使我可以在数据集中再添加一列 - “kmeans categories”。现在它有 25 列 - 24 列每小时速度数据和 1 列类别数据(例如,具有 8 个唯一值 0、1、2、3、4、5、6、7)。然后我想为每个 kmeans 类别计算平均每小时速度,这样我最终可以得到一个 8 行 24 列的数据集,每行都是一个 kmeans 类别。但是,使用下面的代码,我只能得到 5 行和 24 列的数据。5 行是 0-4 的,我希望 0-7 有 8 行。可能出了什么问题???

代码:

speed_kmeans= speed.groupby(['kmeans']).mean()

标签: pythonpandasgroup-by

解决方案


推荐阅读