python - 如何在特定数据子集上前滚并修改原始数据集?
问题描述
我正在尝试对此数据集执行此操作。我正在尝试计算数据集特定子集的累积总和。我希望这些更改反映在真实数据集上。. 下表说明了我想如何计算Offset。
#OFFSET
min = data.exit_block.min()
max = data.exit_block.max()
temp = 0
data['Offset']
for i in tqdm(range(min,min+10)):
offset = data.loc[(data["exit_block"] >= i) & (data["entry_block"] < i)]['size'].sum()
data.loc[data["entry_block"] == i ,'Offset'] = data[data['entry_block']==i]['size'].cumsum() + offset
print(len(data.loc[(data["exit_block"] >= i) & (data["entry_block"] < i)]['size']))
print(offset)
print(data[data['entry_block']==i]['size'].cumsum().head() )
print(data[data['entry_block']==i]['size'].head())
break
在上面的代码中,我从原始数据集创建数据集 B,并尝试从数据集 B驱动的值对原始数据集执行累积和运算。
指数 | 入口块 | 退出块 | 尺寸 | 抵消 |
---|---|---|---|---|
1 | 10 | 20 | 10 | 10 |
2 | 11 | 20 | 150 | 160 |
3 | 18 | 20 | 100 | 260 |
4 | 19 | 21 | 40 | 300 |
5 | 20 | 21 | 120 | 120 |
6 | 20 | 21 | 180 | 300 |
7 | 20 | 21 | 210 | 510 |
8 | 20 | 21 | 90 | 600 |
9 | 20 | 21 | 450 | 1050 |
解决方案
推荐阅读
- python - 如何在python中仅选择小于相关阈值的变量
- linux - 使用 git diff 复制另一个目录中的更改
- unix - 有什么办法可以看到 3 种方法来解决错误?
- css - 部署到 Windows Server 2019 IIS 后,Vue.js 无法扩展
- c++ - 为什么我在继承程序中得到垃圾总和?
- python - (Python)如何覆盖列表的方法python?
- reactjs - React useeffect缺少依赖项以更新数组中的第一项
- python - 在 Django Admin 中更新购物车以添加和删除项目
- html - jQuery - 从一个元素中获取类并添加到另一个元素
- php - Laravel 在运行测试套件时忽略了关系中的大小写敏感性