python - 当一列中有多行重复值时选择第一行
问题描述
当一列中有多行重复值时,我想选择第一行。
例如:
import pandas as pd
df = pd.DataFrame({'col1':['one', 'one', 'one', 'one', 'one', 'one', 'one', 'one'],
'col2':['ID=ABCD1234', 'ID=ABCD1234', 'ID=ABCD1234', 'ID=ABCD5678',
'ID=ABCD5678', 'ID=ABCD5678', 'ID=ABCD9102', 'ID=ABCD9102']})
熊猫数据框如下所示:
print(df)
col1 col2
0 one ID=ABCD1234
1 one ID=ABCD1234
2 one ID=ABCD1234
3 one ID=ABCD5678
4 one ID=ABCD5678
5 one ID=ABCD5678
6 one ID=ABCD9102
7 one ID=ABCD9102
我希望选择第 0 行、第 3 行和第 6 行并将其作为新数据框输出。
预期输出:
col1 col2
0 one ID=ABCD1234
3 one ID=ABCD5678
6 one ID=ABCD9102
解决方案
您可以使用:
df.drop_duplicates(subset = ['col2'], keep = 'first', inplace = True)
推荐阅读
- php - 如何使用 PHP 对大型文本文件进行排序并搜索重复项?
- spring-boot - 如何正确处理 SOAP Web 服务引发的客户端异常
- c# - 实体框架通用方法不接受包含方法
- scala - 如何在不使用可变变量的情况下在 scala 中编写迭代器?
- java - Syncfusion PDF Viewer 中不显示上传的 PDF?
- php - 在 Laravel 中使用中间件缩短 URL 代码
- sql-server - SQL server 函数如何在查询中使用参数
- python - 如何将jpg格式的数据框转换为csv?
- powershell - 如何修改文件中一行的一部分?
- wordpress - 每当客户给予 5 星评价时,如何向管理员发送电子邮件?