首页 > 解决方案 > 如何过滤数据集以仅包含特定关键字?

问题描述

我有包含多个国家的数据集。如何过滤它以使其仅包含特定国家/地区?

在此处输入图像描述

例如现在它包含英国,比利时,法国,...等

我想对其进行过滤,使其仅显示法国和比利时。

到目前为止,我已经尝试过:

dataset = dataset.loc[dataset.Country == "France"].copy()
dataset.head()

它有效,因为它只过滤法国的数据,但如果我添加比利时

dataset = dataset.loc[dataset.Country == "France","Belgium"].copy()
dataset.head()

它不再起作用了。我收到以下错误:

'the label [Belgium] is not in the [columns]'

任何帮助将不胜感激。

标签: pythonpandas

解决方案


您尝试的失败是因为它被'Belgium'视为要查找的列,而该列不存在。如果要过滤多个值,请使用isin

dataset = dataset[dataset['Country'].isin([ "France","Belgium"])].copy()

当您loc在逗号被视为要查找的标签之后使用参数时,在这种情况下在列轴中


推荐阅读