python - 如何计算一个单词是否出现在数据框的列表中?
问题描述
我有以下带有布局的数据框和以下列表:
S/N Summary
1 government government spending spending
2 government money spending spending
list_1 = ['government', 'money', 'spending']
我想确定我的列表中出现在数据框中的唯一单词数。
预期输出。
S/N Summary List 1
1 government government spending spending 2
2 government money spending spending 3
解决方案
尝试这个:
set_1 = set(list_1)
df['Summary'].str.split().map(lambda words: len(set_1.intersection(words)))
首先,我们将字符串拆分为单词列表,然后对于每个列表,words
我们计算集合交集的大小,这有效地计算了唯一匹配。
推荐阅读
- javascript - Node js MongoDB登录系统数据库值未定义
- javascript - 用 npm start 启动我的机器人不起作用!不和谐.js
- regex - 雪花正则表达式语法问题
- php - 为什么数据库的“id”列的值显示为空?
- javascript - 在 promise 或 observable 中,resolve 或subscriber 的真正含义是什么?
- python - 使用子进程从另一个驱动器调用程序时出现权限错误
- c# - 当我在 Azure VM 中尝试使用带有 Database1.mdf 文件的 EF Core 控制台应用程序时,它不起作用
- gcc - gccmakedep 错误:#error 此文件需要对 ISO C++ 2011 标准的编译器和库支持
- python - 如何对数据框中的多个列进行分组?
- vue.js - “TypeError:无法读取未定义的属性'get'”,Axios,Vue.JS