首页 > 解决方案 > Pandas Multindex:迭代行并添加特定值以创建新变量

问题描述

我有一个带有 Multindex (iddatetime)的熊猫数据框和一个名为 X1 的列。

                                X1
id          datetime          
a1ssjdldf   2019 Jul 10          2  
            2019 Jul 11         22  
            2019 Jul 12         21
r2dffs      2019 Jul 10         14  
            2019 Jul 11         13  
            2019 Jul 12         11

我想创建一个新变量 X2,其中对应的值是同一行的 X1 值与前一行的 X1 值之间的差。但是每次它看到一个新的 id 时,相应的值都必须从零重新开始。

例如:

                                X1          X2
id          datetime          
a1ssjdldf   2019 Jul 10          2           0
            2019 Jul 11         22          20  
            2019 Jul 12         21          -1
r2dffs      2019 Jul 10         14           0
            2019 Jul 11         13          -1
            2019 Jul 12         11          -2

标签: pythonpandasdataframe

解决方案


由第一级使用DataFrameGroupBy.diff并将缺失值替换为Series.fillna

df['X2'] = df.groupby(level=0)['X1'].diff().fillna(0, downcast='int')
print (df)
                       X1  X2
id        datetime           
a1ssjdldf 2019 Jul 10   2   0
          2019 Jul 11  22  20
          2019 Jul 12  21  -1
r2dffs    2019 Jul 10  14   0
          2019 Jul 11  13  -1
          2019 Jul 12  11  -2

推荐阅读