首页 > 解决方案 > 尝试通过 cut 创建 bin 列时出错

问题描述

我在尝试创建具有以下分箱值的列时遇到错误:

bins = [1, 10, 20, 21, 34]
labels = [1-10, 11-20, 21-34, 35]
df['binned'] = pd.cut(df['Number of Clinics'], bins=bins, labels=labels)

我收到错误:ValueError: Categorical categories must be unique

不确定我错过了什么?诊所数列只包含一个介于 1 和 100 之间的值,我想在 1-10、11-20、21-34 和 35+ 之间分箱,谢谢

标签: pythonpython-3.xpandasdata-science

解决方案


更改labelsstr并更正您的bin

bins = [1, 10, 20, 34, 100]
labels = ['1-10', '11-20', '21-34', '35+']

推荐阅读