首页 > 解决方案 > Pandas 中的滚动平均值

问题描述

我有一个包含 2 列的数据框 - 日期和价格。数据首先按最新日期排序(第一行为 1 月 23 日,第二行为 1 月 22 日,依此类推)。

Date   Price
23 Jan 100
22 Jan 95
21 Jan 90
.
.
.

我想计算这个时间序列数据的 2 天滚动平均价格。我正在使用这个:

df.rolling(2).mean()

它的作用是,它将 NaN 分配给第一行(1 月 23 日),然后将第二行的输出作为 1 月 23 日和 1 月 22 日的价格平均值。这没有用,因为 1 月 22 日的平均值使用的是远期数据( 1 月 23 日的价格)。我需要的是 1 月 23 日的移动平均值是 1 月 23 日和 1 月 22 日的平均值。这样 MA 的最后一个值将是 NaN 而不是第一个值。

我不想做的是先用最旧的数据对这些数据进行排序,然后再计算。

我对 pct_change() 有同样的问题。但是, pct_change(-1) 解决了这个问题。但是滚动不接受负值作为输入。请建议解决此问题的方法。谢谢。

标签: pythonpandasmoving-averagerolling-average

解决方案


由于您不想排序,因此这是一种解决方法。您可以反转您的数据框,采用滚动平均值,然后再次反转它。

df[::-1].rolling(window=2).mean()[::-1]

输出:

        Price
23 Jan  97.5
22 Jan  92.5
21 Jan  NaN

推荐阅读