首页 > 解决方案 > 比较python数据框中2列的列表并计算相同的项目

问题描述

如何比较 python 数据框中的 2 列列表并计算数据框中这 2 列之间的相同列表。例如:

column A            |   column B
====================================
['a', 'b', 'c']     | ['a', 'b']
['a', 'b']          | ['a']
['b']               | ['a']  

我想得到这个结果:

    column A            |   column B    | count_same_item
    ======================================================
    ['a', 'b', 'c']     | ['a', 'b']    | 2
    ['a', 'b']          | ['a']         | 1
    ['b']               | ['a']         | 0

非常感谢任何帮助

标签: pythonlistdataframe

解决方案


尝试这个:

df['count_same_item'] = df.apply(lambda x: len(set(x['column A']) & set(x['column B'])), axis=1)
print(df)

输出:

    column A column B  count_same_item
0  [a, b, c]   [a, b]                2
1     [a, b]      [a]                1
2        [b]      [a]                0

推荐阅读