首页 > 解决方案 > 计算数据框中数字连续出现的次数

问题描述

我有一个包含 1 和 0 的虚拟列的数据框,我想为每一行计算 1 或 0 出现的次数,每次从 0 开始,向上计数为 1,向下计数为 0 我有下面的一个例子:

 import pandas as pd
 df = pd.DataFrame({'Dummy': [0, 0, 1, 1, 1, 0, 1, 1, 1, 1],
        'Counter': [-1, -2, 1, 2, 3, -1, 1, 2, 3, 4]})

标签: pandasdataframepandas-groupby

解决方案


我们试试看:

blocks = df.Dummy.diff().ne(0).cumsum()
counters = df.groupby(blocks).cumcount() + 1
df['Counter'] = np.where(df['Dummy']==0, -1, 1) * counters

输出:

   Dummy  Counter
0      0       -1
1      0       -2
2      1        1
3      1        2
4      1        3
5      0       -1
6      1        1
7      1        2
8      1        3
9      1        4

推荐阅读