首页 > 解决方案 > 删除每一行熊猫python中每一列中的重复值

问题描述

我有 4 列(名称、区域、州、电子邮件)。在我分组并加入值之后,在列电子邮件中具有重复的电子邮件。输出结果是:

Area    Group   Shift         Email
KM      MFG     A1,A2,A3      a@gmail.com,a@gmail.com,b@gmail.com
RIM     TEST    A1,B1         c@gmail.com,b@gmail.com,c@gmail.com
PNG    FINISH   C1,C2,C3      a@gmail.com,c@gmail.com,a@gmail.com
KL     Manager  NORMAL,B1,B1  b@gmail.com,a@gmail.com,c@gmail.com,a@gmail.com

我需要删除“电子邮件”列中的重复电子邮件。任何人都可以帮助我吗?

标签: pythonpandas

解决方案


让我们试试

df.Email=df.Email.str.split(',').apply(set).str.join(',')
df
  Area    Group         Shift                                Email
0   KM      MFG      A1,A2,A3              a@gmail.com,b@gmail.com
1  RIM     TEST         A1,B1              c@gmail.com,b@gmail.com
2  PNG   FINISH      C1,C2,C3              c@gmail.com,a@gmail.com
3   KL  Manager  NORMAL,B1,B1  c@gmail.com,a@gmail.com,b@gmail.com

推荐阅读