首页 > 解决方案 > 如何创建一个数据框聚合(分组?)一个只包含字符串的数据框

问题描述

我想创建一个“聚合”更大数据集的数据框。

开始:

东风:

  col1 col2 
1    A    B
2    A    C
3    A    B

并得到:

df_聚合:

  col1  col2
1     A    B
2     A    C

不使用任何计算 (count())

我会写:

df_aggreagated = df.groupby('col1')

但我什么也没得到

打印(df_aggregated)

“错误”

任何帮助表示赞赏

标签: pythonpandasdataframegroup-by

解决方案


您可以通过使用以下df.drop_duplicates函数简单地删除重复条目来完成此操作:

df_aggregated = df.drop_duplicates(subset=['col1', 'col2'], keep=False)
print(df_aggregated)
   col1 col2
1    A    B
2    A    C

推荐阅读