首页 > 解决方案 > 将我的数据集分组为 2 个样本时出现 KeyError

问题描述

我正在参加在线课程。'bikesharing_data' 是 pandas 对象的名称,'workingday' 是该数据框中列的名称。导师想将数据集分成两个样本,并将“工作日”分成 ([0, 1]) 组。这是她写的:

sample_01 = bikesharing_data[(bikesharing_data['workingday'] == 1)]

sample_02 = bikesharing_data[(bikesharing_data['workingday'] == 0)]

我的问题是如果我将样本划分如下:

sample_01 = bikesharing_data['workingday' == 1]

它给了我KeyError。我了解 KeyError 是什么,但为什么会引发关键错误?

标签: pythonpandasstatistical-testdata-wrangling

解决方案


'workingday' == 1

这会产生一个布尔值。因此,对于您的示例,这相当于调用sample_01 = bikesharing_data[False]'

因为字符串不等于 1。如果 False 不是您的集合中的键,您会得到一个KeyError. 您可能希望使用索引作为键,而不是布尔值。


推荐阅读