首页 > 解决方案 > Pandas - 合并具有相同索引的行的单元格

问题描述

我有一个带有一些行的 df,例如:

1 | FII  4440 | Faria Lima     | 14° | Cascione, Pulino, Boulos
1 | FII  4440 | Faria Lima     | 15° | Warrant
1 | FII  4440 | Faria Lima     | 16° | Warrant
2 | Malls     | São Paulo      | N   |  None
3 | Malls     | Cidade Jardim  | N   |  None

我需要输出如下:

1 | FII  4440 | Faria Lima     | 14º, 15º, 16° | Cascione, Pulino, Boulos, Warrant
2 | Malls     | São Paulo      | N             |    None
3 | Malls     | Cidade Jardim  | N             |    None

也就是说,对于相同的索引(第一列),它应该连接字符串而不重复列。谁能帮我这个?

标签: pythonpandasaggregate

解决方案


我注意到分组标准只能是最左边的列。

假设列名是C0C1,...,尝试:

df.groupby('C0').agg(lambda grp: ', '.join(grp.unique())).reset_index()

推荐阅读