首页 > 解决方案 > Pandas 按降序枚举组

问题描述

我有以下专栏:

   column
0      10
1      10
2       8
3       8
4       6
5       6

我的目标是找到今天的唯一值(在本例中为 3)并创建一个新列,该列将创建以下内容

   new_column
0           3
1           3
2           2
3           2
4           1
5           1

编号从唯一值的长度 (3) 开始,如果当前行与基于原始列的前一行相同,则重复相同的编号。随着行值的变化,数字会减少。原始列中的所有唯一值都具有相同的行数(在这种情况下,每个唯一值有 2 行)。

我的解决方案是按原始列分组并创建一个新列表,如下所示:

i=1
new_time=[]
for j, v in df.groupby('column'):
    new_time.append([i]*2)
    i=i+1

然后我会按降序展平列表排序。还有其他更简单的解决方案吗?

谢谢。

标签: pythonpandasdataframegroup-bypandas-groupby

解决方案


pd.factorize

i, u = pd.factorize(df.column)
df.assign(new=len(u) - i)

   column  new
0      10    3
1      10    3
2       8    2
3       8    2
4       6    1
5       6    1

dict.setdefault

d = {}
for k in df.column:
    d.setdefault(k, len(d))

df.assign(new=len(d) - df.column.map(d))

推荐阅读