首页 > 解决方案 > 如何计算一个单词是否出现在数据框的列表中?

问题描述

我有以下带有布局的数据框和以下列表:

S/N Summary
1   government government spending spending
2   government money spending spending 

list_1 = ['government', 'money', 'spending']

我想确定我的列表中出现在数据框中的唯一单词数。

预期输出。

S/N Summary                                    List 1
1   government government spending spending    2
2   government money spending spending         3

标签: python

解决方案


尝试这个:

set_1 = set(list_1)
df['Summary'].str.split().map(lambda words: len(set_1.intersection(words)))

首先,我们将字符串拆分为单词列表,然后对于每个列表,words我们计算集合交集的大小,这有效地计算了唯一匹配。


推荐阅读