首页 > 解决方案 > pandas groupby 一连串数字

问题描述

我有一个这样的数据框:

df = pd.DataFrame({'dir':[0,0,0,1,1,0,1], 'price': [100, 102, 110, 120, 125, 200, 210]})

   dir  price
0    0    100
1    0    102
2    0    110
3    1    120
4    1    125
5    0    200
6    1    210

我想将 0 和之后的 1 分组。我想要的结果如下所示:

   dir  price
0    0    100
1    0    102
2    0    110
3    1    120
4    1    125

   dir  price
5    0    200
6    1    210

标签: pythonpandas

解决方案


diffcumsumif it is一起使用10您将开始计数为一个新组,因此diff应该等于(eq-1

for x , y in df.groupby(df.dir.diff().eq(-1).cumsum()): 
    print(y)



   dir  price
0    0    100
1    0    102
2    0    110
3    1    120
4    1    125
   dir  price
5    0    200
6    1    210
d={x: y  for x , y in df.groupby(df.dir.diff().eq(-1).cumsum())}

推荐阅读