首页 > 解决方案 > 在 Python 中使用多列将行合并为一

问题描述

已解决 - 我使用的原始数据集存在问题

我有一个大的处方数据csv文件,第一列包含发行年份,第二列包含化学物质的名称,第三列是实践,4列项目数。

Year       Chemical substance     Practice   Items     
2019       Bisoprolol             Practice A 10         
2019       Bisoprolol             Practice B 12
2020       Bisoprolol             Practice A 13
2020       Bisoprolol             Practice B 15
2019       Omeprazole             Practice A 12
2019       Omeprazole             Practice B 12
2020       Omeprazole             Practice A 13
2020       Omeprazole             Practice B 15
2019       Tolteridone            Practice A 13
2019       Tolteridone            Practice B 14
2020       Tolteridone            Practice A 12
2020       Tolteridone            Practice B 12

我想将练习和年份的数据结合起来,以便为我提供每次练习的总发行量,类似于此输出,

Chemical substance    Practice    Items
Bisoprolol            Practice A  23
Bisoprolol            Practice B  27

我试过groupby,

merged_df = prescribingdata_df.groupby(['Chemical substance', 'Practice']).agg('sum')

但我只是得到与原始数据相同的数据输出。有没有办法根据 2 列组合两行?以便显示当年的数据和实践?

标签: python

解决方案


数据中似乎有错误,因为当我在另一个笔记本上再次运行它时它运行良好


推荐阅读