首页 > 解决方案 > 熊猫排在 groupby 和 cut 之后

问题描述

我需要将组分成连续的、密集的、整数值的箱。这段代码是我的尝试,但它不能正常工作。看起来分组在排名之前丢失了。

groups = [1] * 8 + [2] * 8
values = [11,12,13,11,12,13,11,12,  21,22,23,24,25,26,27,28]
series = pd.Series(values, index=groups)

grouped = series.groupby(series.index)
cut = grouped.apply(pd.cut, bins=4)
ranked = cut.rank(method="dense", ascending=True)
result = ranked.astype(int)

# This is the desired result:
assert list(result) == [1,2,3,1,2,3,1,2, 1,1,2,2,3,3,4,4]

任何好的想法如何正确地做到这一点?

标签: pythonpandaspandas-groupby

解决方案


改成transform

grouped.transform(lambda x : pd.cut(x, bins=4).factorize()[0]+1)

推荐阅读