python - 删除每一行熊猫python中每一列中的重复值
问题描述
我有 4 列(名称、区域、州、电子邮件)。在我分组并加入值之后,在列电子邮件中具有重复的电子邮件。输出结果是:
Area Group Shift Email
KM MFG A1,A2,A3 a@gmail.com,a@gmail.com,b@gmail.com
RIM TEST A1,B1 c@gmail.com,b@gmail.com,c@gmail.com
PNG FINISH C1,C2,C3 a@gmail.com,c@gmail.com,a@gmail.com
KL Manager NORMAL,B1,B1 b@gmail.com,a@gmail.com,c@gmail.com,a@gmail.com
我需要删除“电子邮件”列中的重复电子邮件。任何人都可以帮助我吗?
解决方案
让我们试试
df.Email=df.Email.str.split(',').apply(set).str.join(',')
df
Area Group Shift Email
0 KM MFG A1,A2,A3 a@gmail.com,b@gmail.com
1 RIM TEST A1,B1 c@gmail.com,b@gmail.com
2 PNG FINISH C1,C2,C3 c@gmail.com,a@gmail.com
3 KL Manager NORMAL,B1,B1 c@gmail.com,a@gmail.com,b@gmail.com
推荐阅读
- linux - 如何使用 selenium 脚本处理弹出窗口以在 Linux 机器中上传文件
- java - Spring Integration Task Executor 在测试期间大约 1000 毫秒后死机而没有警告
- json - 使用 System.Text.Json 序列化实现接口的对象
- mysql - 创建未分组的元素总和
- pyspark - 无法初始化 Spark
- python - Trackpy:如何去除不需要的粒子
- apache-camel - 在普罗米修斯仪表板中找不到微服务的 jaeger 分布式延迟指标
- node.js - Nodejs:避免消费者创建临时的rabbitmq队列
- r - 如何在 R 中创建存储为列表的回归结果直方图
- java - 使用参数调用 POST 方法时无法获得正确的响应