python - 使用 python Pandas 在 excel 单元格中查找确切的关键字
问题描述
我在这里寻找一些帮助。我有两个数据框 DF1 和 DF2。DF1 包含员工编号及其姓名。DF2 包含员工编号和评论列。我想查找 DF2 中的 Comments 列是否包含 DF1 中存在的与其 Emp 编号唯一值相对应的名称。如果名称存在于 DF2 的 Comments 列中,则应返回“名称存在”。如果名称在注释列中不存在,则应返回“名称不存在”
感谢有人可以提供帮助。TIA
解决方案
使用numpy.where
withSeries.str.contains
正则表达式和\b\b
单词边界,re.escape
如果可能的话,使用一些特殊的正则表达式字符:
import re
pat = '|'.join(r"\b{}\b".format(re.escape(x)) for x in DF1['Name'])
DF2['new'] = np.where(DF2['Name'].str.contains(pat),
'Name exist',
'Name does not exist')
推荐阅读
- c - 我有一个名称列表,必须返回 C 中每个名称的数量
- android - Android Studio - 光标子句的问题 WHERE OR
- python - JSONDecorderError:期望值
- c++ - VSCode 和 C 环境
- python - Xpath 和 css_selectors 无法提取动态内容。(使用 Python 和 Selenium)
- javascript - 如何让捆绑恐惧症在出口分析中显示不同的尺寸?
- android - 特定于应用程序的外部存储:其他应用程序如何访问它?
- python - 如何在pyspark的表达式中避免多个窗口函数
- assembly - 程序集计算变量的位置
- swift - 我如何在 ios 中集成万事达卡 sdk