首页 > 解决方案 > 按组创建索引列

问题描述

我想索引我的数据框,以便在每个组中它从 0 开始到组中的观察数。即来自:

pd.DataFrame([["John","Car"],["John","House"],["Sam","Skate"],["Sam","Disco"],["Sam","Space"]])

我想拥有 :

pd.DataFrame([["John","Car",0],["John","House",1],["Sam","Skate",0],["Sam","Disco",1],["Sam","Space",2]])

谢谢

标签: pythonpandasdataframe

解决方案


您正在寻找累积计数功能:

df = pd.DataFrame([["John","Car"],["John","House"],["Sam","Skate"],["Sam","Disco"],["Sam","Space"]])
df.groupby(0).cumcount()

推荐阅读