首页 > 解决方案 > 根据列的唯一和重复值从现有数据框创建两个新数据框

问题描述

colA colB
 A    125
 B    546
 C    4586
 D    547
 A    869
 B    789
 A    258
 E    123

我想创建两个新的数据框,第一个应该基于“colA”中的唯一值,第二个应该是“colB”的重复值。colB 没有重复值。第一个输出是这样的:

ColA colB
 A   125
 B   546
 C   4586
 D   547
 E   123

第二个输出是这样的:

colA colB
 A   869
 B   789
 A   258

标签: python-3.xpandasdataframe

解决方案


对于第一组,使用drop_duplicates. 对于第二组,使用duplicated

print (df.drop_duplicates("colA"))

  colA  colB
0    A   125
1    B   546
2    C  4586
3    D   547
7    E   123

print (df[df.duplicated("colA")])

  colA  colB
4    A   869
5    B   789
6    A   258

推荐阅读