首页 > 解决方案 > Python:如何遍历行并根据前一行计算值

问题描述

我有截至 2020 年 7 月的销售数据,并希望使用恢复率来预测未来 3 个月。这是数据框:

test = pd.DataFrame({'Country':['USA','USA','USA','USA','USA'],
             'Month':[6,7,8,9,10],
              'Sales':[100,200,0,0,0],
              'Recovery':[0,1,1.5,2.5,3]
             })

这是它的外观:

在此处输入图像描述

现在,我想在这个数据框中添加一个“预测”列:

在此处输入图像描述

第 3 行的第一个值 300 基本上是(200 * 1.5/1). 这将是我们前进的基础值,所以下一个值,即 500 基本上是(300 * 2.5/1.5)这样。从第 3 行开始,我如何遍历每一行?我尝试使用 shift() 但无法遍历行。

标签: pythonpandas

解决方案


你可以这样做:

import pandas as pd
test = pd.DataFrame({'Country':['USA','USA','USA','USA','USA'],
             'Month':[6,7,8,9,10],
              'Sales':[100,200,0,0,0],
              'Recovery':[0,1,1.5,2.5,3]
             })

test['Prediction'] = test['Sales']
for i in range(1, len(test)):
    #prevent division by zero
    if test.loc[i-1, 'Recovery'] != 0:
        test.loc[i, 'Prediction'] = test.loc[i-1, 'Prediction'] * test.loc[i, 'Recovery'] / test.loc[i-1, 'Recovery']

推荐阅读