首页 > 解决方案 > 按组和该组中的列删除重复项

问题描述

我正在尝试删除每个组中的重复项,这似乎很简单,因为我在处理组系列时遇到了问题。考虑到这些数据:

import pandas as pd


data = {
  'Keyword': ['car', 'car', 'car', 'bus', 'bus','bus'], 
  'Colour': ['blue','blue','red','blue','yellow','yellow']
}

df = pd.DataFrame(data=data)

print(df)

我得到这个输出

  Keyword  Colour
0     car    blue
1     car    blue
2     car     red
3     bus    blue
4     bus  yellow
5     bus  yellow

我想得到

  Keyword  Colour
0     car    blue
1     car     red
2     bus    blue
3     bus  yellow

我已经尝试过了,但没有在系列上工作

test = df.groupby(['Keyword', 'Colour']).size().drop_duplicates('Colour', keep='first')

标签: python-3.xpandas

解决方案


推荐阅读