首页 > 解决方案 > 如何获得熊猫列的特定百分位跨度?

问题描述

假设我有一个数据框,其中包含有关城市公民的信息,包括他们的收入。我想将收入分成前 1%、接下来 4%、接下来 15%、接下来 20% 和最后 50% 的百分位数,并为每个百分位数计算有多少公民位于这个百分位数、平均值、他们的收入总和等..

我知道如何使用 numpy.percentile 方法找到百分位数,但我无法弄清楚例如如何找到前 1% 和其余 95% 之间的 4%

标签: pythonpandasnumpy

解决方案


你想要pd.qcut

pd.qcut(df['income'], [0,.5,.6,.8, .95, .99,1])

会给你削减相应的桶,你可以传递给groupby.


推荐阅读