python - 尝试通过 cut 创建 bin 列时出错
问题描述
我在尝试创建具有以下分箱值的列时遇到错误:
bins = [1, 10, 20, 21, 34]
labels = [1-10, 11-20, 21-34, 35]
df['binned'] = pd.cut(df['Number of Clinics'], bins=bins, labels=labels)
我收到错误:ValueError: Categorical categories must be unique
不确定我错过了什么?诊所数列只包含一个介于 1 和 100 之间的值,我想在 1-10、11-20、21-34 和 35+ 之间分箱,谢谢
解决方案
更改labels
为str
并更正您的bin
bins = [1, 10, 20, 34, 100]
labels = ['1-10', '11-20', '21-34', '35+']
推荐阅读
- r - 如何从 SQL Server R 存储过程返回列名和汇总值?
- c - 如何从 C 文件中获取完整的汇编代码?
- amazon-web-services - 使用 aws Lambda 时无法加载 kinesis 本机库
- python - 在扇区中分割图像
- video-editing - 如何在 DaVinci Resolve 中旋转视频?
- scala - 在 Scala 中使用选项(最佳实践)
- python - 烛台图:根据未来警告替换 in.resample() 中的“如何”
- javascript - 如何在匿名函数javascript中为函数实现不同的行为
- c++ - 应用函数后查找重复值的函数
- jquery - 动画/过渡不适用于 fancybox 3.3.5 和 Internet Explorer(在 ie 11 上测试)