python - 如何使用“重复且唯一”制作新列
问题描述
我的.csv
档案
IP
192.168.1.1
192.168.1.1
192.168.1.2
192.168.1.3
如果在提到的新列中找到重复项。
预期输出:
IP un_dup
-------------------------
192.168.1.1 duplicate
192.168.1.1 duplicate
192.168.1.2 unique
192.168.1.3 unique
我的代码来查找重复项
IP = [('192.168.1.1'),
('192.168.1.1'),
('192.168.1.2'),
('192.168.1.3')]
dfIP = pd.DataFrame(IP, columns=['IP'])
dfIPdup = dfIP[dfIP.duplicated()]
#logic is we got the duplicate and now add a column and mention 'duplicate' or unique
解决方案
这应该有效:
import pandas as pd
import numpy as np
df = pd.read_csv('input.csv')
df['un_dup'] = np.where(df['IP'].duplicated(keep=False),'duplicate', 'unique')
print(df)
推荐阅读
- database - 我如何映射流
- > 列出
在飞镖颤振中 - mediawiki - 我的 MediaWiki 上的通缉页面无法正常工作 我该如何解决这个问题?
- java - 如何在代码视图上使用滚动视图?
- ruby - MAC M1 ARM Core - Ruby 和 Gem pg 安装问题
- java - 从自定义类获取形状以添加到驱动程序类的问题
- python - 通过字符串而不是数组返回张量流预测
- javascript - 使用 react-native-community/datetimepicker 时收到错误“来自 JS 的错误调用”
- python - 有没有一种编码方法来检查调色板是否遵循类似、单色、三色等色轮的配色方案?
- python - 如何为满足特定条件的数据框行赋值?
- python - 如何拆分此 Python 字符串以获得有意义的输出?