python - 如何创建一个数据框聚合(分组?)一个只包含字符串的数据框
问题描述
我想创建一个“聚合”更大数据集的数据框。
开始:
东风:
col1 col2
1 A B
2 A C
3 A B
并得到:
df_聚合:
col1 col2
1 A B
2 A C
不使用任何计算 (count())
我会写:
df_aggreagated = df.groupby('col1')
但我什么也没得到
打印(df_aggregated)
“错误”
任何帮助表示赞赏
解决方案
您可以通过使用以下df.drop_duplicates
函数简单地删除重复条目来完成此操作:
df_aggregated = df.drop_duplicates(subset=['col1', 'col2'], keep=False)
print(df_aggregated)
col1 col2
1 A B
2 A C