python - pandas 分割成区间超参数
问题描述
我试图在一个间隔列上匹配多个数据帧,这是 pd.cut() 函数的结果。但是,由于 pd.cut() 产生不同的结果,匹配不起作用。
例如:在将浮点数系列切割成 [15, 16, 17, 18] 的 bin 时,pd.cut 函数有时会产生以下间隔 -选项 A:
(15, 16], (16, 17], (17, 18]
有时它会产生以下间隔 - 选项 B:
(15.0, 16.0], (16.0, 17.0], (17.0, 18.0]
精度等超参数的变化无济于事。有趣的是,当您按间隔分组时,对于选项 B 结果,分组名称实际上是选项 A - (15, 16], (16, 17], (17, 18]
我应该为 pd.cut() 函数使用哪些超参数?
解决方案
是的,它有效,一个可能的解决方案是手动为 pd.cut() 间隔添加标签作为图例。
df['a_groups'] = pd.qcut(df.a, q=3, labels=['(15, 16]', '(16, 17]', '(17, 18]'])
推荐阅读
- css - 在 2 行和 2 列中打破 4 个 div 响应
- extjs - 在 extjs 中定义商店与创建商店
- eclipse - Eclipse Photon - 错误的键盘布局仅适用于快捷方式
- gradle - 在特定项目中禁用 Gradle 守护进程
- c# - 分析项目:无法将修改保存到服务器。返回错误:'OLE DB 或 ODBC 错误:我们无法将值 null 转换为逻辑类型
- javascript - 能够在渲染 highcharts 后显示选中系列的标签
- jenkins - 可以使用 codeceptjs 看到 jenkins 的诱惑结果
- angular - 将 Web 组件中的 CustomEvent 发送到 Angular
- google-cloud-platform - 如何在 gcp 中停止出口流量
- javascript - jQuery 在“每次”迭代中休眠,并在迭代完成时调用函数