首页 > 解决方案 > 合并填充的行单元格并忽略Python中的空单元格

问题描述

经过一些数据预处理后,我坚持合并数据集。我想要做的是根据相同的批次号将同一列下的所有日期按行顺序合并。通常它是堆叠的数据,然后我根据流程步骤(40,42,50)进行了堆叠。那么我的意图是将两列的时间差作为分钟。

数据集:

         process     40-------------------42-----------------------50

index   batch   

64177   699042  NaT------------------2019-01-10 18:28:05-------NaT

171272  699042  NaT------------------NaT-------------------- 2019-01-10 18:28:20

120655  699042  2019-01-10 17:40:09--NaT----------------------NaT

120656  699043  2019-01-10 17:40:09--NaT----------------------NaT

67362   699043  NaT------------------2019-01-10 20:43:25-------NaT

168373  699043  NaT------------------NaT-----------------------2019-01-10 20:43:33

我想要的是:

         process     40-------------------42-----------------------50
batch   

699042  2019-01-10 17:40:09-----2019-01-10 18:28:05-------2019-01-10 18:28:20

699043  2019-01-10 17:40:09----2019-01-10 20:43:25-------2019-01-10 20:43:33

标签: pythonpandasmerging-data

解决方案


你可以groupby试试first

urdf=df.groupby(level=1).first()

推荐阅读