首页 > 解决方案 > 如何在数据框中合并同一对象的数据?

问题描述

我们知道毛毛虫有可能变成蝴蝶,蝌蚪变成青蛙。权重数据对不同类型的同名是专有的(同一列中至少有一个等于0)。如何组合与新数据框同名的数据(如果存在,则仅保存最新类型),如下所示。

old_df = {'name':  ['a', 'b', 'b', 'c', 'd', 'd', 'e'],
        'type': ['tiger', 'caterpillar', 'butterfly', 'dolphin', 'tadpole', 'frog', 'dog'],
        'month1_weight': ['33', '0', '0', '59', '3', '0', '0'],
        'month2_weight': ['0', '0', '20', '65', '0', '10', '2'],
        }
old_dataframe = pd.DataFrame(old_df)
old dataframe:
name      type         month1_weight  month2_weight
a         tiger        33             0
b         caterpillar  0              0
b         butterfly    0              20
c         dolphin      59             65
d         tadpole      3              0
d         frog         0              10
e         dog          0              2

new dataframe:
name      type         month1_weight  month2_weight
a         tiger        33             0
b         butterfly    0              20
c         dolphin      59             65
d         frog         3              10
e         dog          0              2

标签: pythondataframefilter

解决方案


利用:

new_dataframe = (
    old_dataframe.groupby("name")
    .agg({
        "type": "last",
        "month1_weight": lambda s: s.astype(int).sum().astype(str),
        "month2_weight": lambda s: s.astype(int).sum().astype(str)})
    .reset_index()
)

print(new_dataframe)

这打印:

  name       type month1_weight month2_weight
0    a      tiger            33             0
1    b  butterfly             0            20
2    c    dolphin            59            65
3    d       frog             3            10
4    e        dog             0             2

推荐阅读