python-3.x - 按组和该组中的列删除重复项
问题描述
我正在尝试删除每个组中的重复项,这似乎很简单,因为我在处理组系列时遇到了问题。考虑到这些数据:
import pandas as pd
data = {
'Keyword': ['car', 'car', 'car', 'bus', 'bus','bus'],
'Colour': ['blue','blue','red','blue','yellow','yellow']
}
df = pd.DataFrame(data=data)
print(df)
我得到这个输出
Keyword Colour
0 car blue
1 car blue
2 car red
3 bus blue
4 bus yellow
5 bus yellow
我想得到
Keyword Colour
0 car blue
1 car red
2 bus blue
3 bus yellow
我已经尝试过了,但没有在系列上工作
test = df.groupby(['Keyword', 'Colour']).size().drop_duplicates('Colour', keep='first')
解决方案
推荐阅读
- java - 用Java实现CustomList的List接口
- npm - npm install 导致 core-js 安装后错误,Plesk 环境中的 Nuxt 应用程序
- java - IntelliJ Spring启动项目突然报错所有包都不存在
- tkinter - 测试(Python)tkinter 菜单对话框?
- sql-server - 使用 XQUERY 正确地将 XML 节点中的值替换为引用节点并过滤所需的值
- react-native - 当嵌套导航器在 android 和 ios 中反应原生时,反应导航 5 深层链接不起作用
- command-line - 如何将路径从“打开方式”传递到由 install4j 创建的可执行文件?
- mousedown - Mousedown 没有在 Gmap-vue 内触发
- javascript - 烧瓶应用程序中的javascript文件未加载
- python - 用python在mac上读取xlsx文件