python-3.x - 根据列的唯一和重复值从现有数据框创建两个新数据框
问题描述
colA colB
A 125
B 546
C 4586
D 547
A 869
B 789
A 258
E 123
我想创建两个新的数据框,第一个应该基于“colA”中的唯一值,第二个应该是“colB”的重复值。colB 没有重复值。第一个输出是这样的:
ColA colB
A 125
B 546
C 4586
D 547
E 123
第二个输出是这样的:
colA colB
A 869
B 789
A 258
解决方案
对于第一组,使用drop_duplicates
. 对于第二组,使用duplicated
:
print (df.drop_duplicates("colA"))
colA colB
0 A 125
1 B 546
2 C 4586
3 D 547
7 E 123
print (df[df.duplicated("colA")])
colA colB
4 A 869
5 B 789
6 A 258
推荐阅读
- spring - 更改了 application.properties 中的 server.port 但无法正常工作
- jquery - 如何在jQgrid中找到当前行?
- javascript - 带有 for 循环的冒泡排序无法按预期工作
- c# - 如何在方法期间通过依赖注入从池中获取 DbContext 的实例?
- reactjs - 如何使用 React Router 访问 Redux 存储?
- shell - ZSH Listen to Command Not Found
- html - Freemarker 模板返回字符串而不是 html 元素
- c - Perl 找不到内联 C 模块:“引导内联模块时出现问题”
- python - 如何在python中为for循环应用多线程
- angular - 来自ngrx 的可观察数据是同步的吗?