首页 > 解决方案 > 如何在特定数据子集上前滚并修改原始数据集?

问题描述

我正在尝试对此数据集执行此操作。我正在尝试计算数据集特定子集的累积总和。我希望这些更改反映在真实数据集上。. 下表说明了我想如何计算Offset

#OFFSET
min = data.exit_block.min() 
max = data.exit_block.max()
temp = 0
data['Offset']
for i in tqdm(range(min,min+10)):
  offset = data.loc[(data["exit_block"] >= i) & (data["entry_block"] < i)]['size'].sum()

  data.loc[data["entry_block"] == i ,'Offset'] = data[data['entry_block']==i]['size'].cumsum() + offset
  print(len(data.loc[(data["exit_block"] >= i) & (data["entry_block"] < i)]['size']))
  print(offset)
  print(data[data['entry_block']==i]['size'].cumsum().head()  )

  print(data[data['entry_block']==i]['size'].head())
  break

在上面的代码中,我从原始数据集创建数据集 B,并尝试从数据集 B驱动的值对原始数据集执行累积和运算。

指数 入口块 退出块 尺寸 抵消
1 10 20 10 10
2 11 20 150 160
3 18 20 100 260
4 19 21 40 300
5 20 21 120 120
6 20 21 180 300
7 20 21 210 510
8 20 21 90 600
9 20 21 450 1050

标签: pythonpython-3.xpandaspython-2.7dataframe

解决方案


推荐阅读