首页 > 解决方案 > 当累积和达到阈值时,Pandas 新列可查找

问题描述

我在 pandas 中有一个表,其 ID 在每个日期时间都重复。我有一行 Cumulative Sum 项目,我想创建一个新列来标识每个 ID 何时满足某个阈值。我在下图中有一个示例。在这里,我有 ID,我正在寻找累积和列何时达到 6。有时,一个 ID 的累积和是 8,但那是达到最小计数 6 的行。一旦达到 6,我希望每个 ID 的下一个累积总和(如果有的话)为假。例如,一旦达到 6,如果 ID 有另一行累积和为 11,我希望它为 False。

在此处输入图像描述

任何帮助表示赞赏!

谢谢

标签: pythonpandascumulative-sum

解决方案


让我们做

idx = df['cumsum value'].ge(6).groupby(df['incident number']).transform('idxmax')
df['new'] = df.index.eq(idx)

推荐阅读