python - 在数据框中搜索重复项(Python)
问题描述
我有一个数据框,它是其他两个的融合。
df = pd.concat([df1, df2])
这个新数据框的索引是专有名称,并且这个数据框 (df) 包含一个“字母”列,其中填充了从“A”到“Z”的随机字母。
我想知道字母“A”和字母“B”是否有重复的行。
也就是说,两条线完全相同(例如:
Letter
jeans 'A'
jeans 'A'
不考虑其他字母的重复。
程序将返回重复 en 'A' 和 'B' 的数量。
解决方案
考虑到您只想计算 A 和 B 的重复值:
df = pd.DataFrame({'Letter':['A','A','A','B','B']})
repetedA = np.where(df[df.Letter.duplicated()].isin(['A']), 1, 0).sum()
repetedB = np.where(df[df.Letter.duplicated()].isin(['B']), 1, 0).sum()
print('A repeated values:', repetedA,
'\nB repeated values:', repetedB)
输出:
A repeated values: 2
B repeated values: 1
推荐阅读
- python - AttributeError:“元组”对象没有属性“超时”-Python3 中的 urllib 请求
- f# - 在 F# 中,如何在不重新评估 seq 的情况下获取 seq 的头/尾
- oracle - Oracle XE 和 DBMS_CRYPTO
- python - How to alter multiple text files using a python script
- php - 需要 Composer 在 cPanel 中添加 Mailgun?
- javascript - 第 3 方身份验证重定向相同域的 AJAX 调用
- python - 如何使用 selenium 和 Python 根据 html 从 span 标签中提取文本
- python - 了解 TensorFlow 检查点加载?
- oracle - 根据用户过滤交互式报表中的数据
- asp.net - 在 ASP .NET Core 2.1 Web Api 中启用 CORS