首页 > 解决方案 > pandas 分割成区间超参数

问题描述

我试图在一个间隔列上匹配多个数据帧,这是 pd.cut() 函数的结果。但是,由于 pd.cut() 产生不同的结果,匹配不起作用。

例如:在将浮点数系列切割成 [15, 16, 17, 18] 的 bin 时,pd.cut 函数有时会产生以下间隔 -选项 A:

(15, 16], (16, 17], (17, 18]

有时它会产生以下间隔 - 选项 B:

(15.0, 16.0], (16.0, 17.0], (17.0, 18.0]

精度等超参数的变化无济于事。有趣的是,当您按间隔分组时,对于选项 B 结果,分组名称实际上是选项 A - (15, 16], (16, 17], (17, 18]

我应该为 pd.cut() 函数使用哪些超参数?

标签: pythonpandasintervals

解决方案


是的,它有效,一个可能的解决方案是手动为 pd.cut() 间隔添加标签作为图例。

df['a_groups'] = pd.qcut(df.a, q=3, labels=['(15, 16]', '(16, 17]', '(17, 18]'])

推荐阅读