首页 > 解决方案 > 如何比较数据框中的两个字符串列表以获取任何匹配项以在 python 中获得 True 或 False?

问题描述

我在由字符串列表组成的数据框中有两列。我想比较列表中的所有项目以查看是否有任何匹配项并返回 True/False(或任何其他标志)列以突出显示任何匹配项。

我试图通过创建集合并逐行比较它们来做到这一点,但是当它应该返回“True”时,我一直得到“False”(“a”在第一列和第二列,所以它应该是 True)。如何比较这两个列表?

df = pd.DataFrame({'one': [['a','bb','b','v'], ['aa','b','c','e']],
                  'two': [['b','aa','a','d'],['b','w','f']]})

df['one'] = df.apply(lambda row: set(row['one']), axis=1)
df['two'] = df.apply(lambda row: set(row['two']), axis=1)

df['check'] = df.apply(lambda row: row['one'] in row['two'], axis=1)

print(df)

我期待一个新列,输出为 True,因为列表中有匹配的项目。

标签: pythonlistdataframe

解决方案


在你的使用以下apply

lambda row: bool(row['one'] & row['two']), axis=1

在这里,因为row['one']row['two']已经转换为集合,执行和&之间的交集运算row['one']row['two']


推荐阅读