首页 > 解决方案 > 为什么这段代码说两个系列比实际更相似

问题描述

series1_values = ['risk no', 'No', 'No', 'No', 'No', 'Yes', 'No', 'Yes',
    'Medium rare', 'Female', '18-29', '$25,000 - $49,999',
    'High school degree', 'South Atlantic']

series1 = pd.Series(series1_values)

series2 = pd.Series(['risk no', 'No', 'Yes', 'Yes', 'No', 'Yes', 'No', 'Yes',
        'Medium rare', 'Female', '60+', '$25,000 - $49,999',
        'High school degree', 'South Atlantic'])


series1.isin(series2)

    0      True
    1      True
    2      True
    3      True
    4      True
    5      True
    6      True
    7      True
    8      True
    9      True
    10    False
    11     True
    12     True
    13     True
    dtype: bool

这段代码表明这两个系列共有 13 个共同值(真值之和),但实际上它们只有 11 个共同值。它从哪里获得额外的两个值?

如果您明白我的意思,索引 2 和 3 也应该等同于 False。

标签: pythonpandasseriescontains

解决方案


推荐阅读