首页 > 解决方案 > 用先前的值乘以常数填充 nan 值的列

问题描述

我有一个 df,其中一些列以多个 nan 值结尾。我想使用 fillna(method='ffill') 或类似的东西将每个 nan col 值与前一个值 * 来自另一个 df 的某个常量相乘。但是,仅使用以下内容是行不通的。在移动到下一个之前需要计算每个 col 值,这是问题吗?

df_new = df.fillna(method='ffill') * constant 

标签: pythonpandasfillna

解决方案


有趣的问题!这不是矢量化解决方案,但它可以逐列工作。

首先设置数据以进行测试 - 将索引设置为最新,因此我们不依赖索引号来提供帮助

A = [np.nan, np.nan, 5.5, 5.7, 5.9, 6.1, 6.0, 5.9, np.nan, np.nan, np.nan,15.0]

df = pd.DataFrame({'A': A}, index=pd.date_range(start='2010', periods=len(A), freq="QS"))

            A
2010-01-01  NaN
2010-04-01  NaN
2010-07-01  5.5
2010-10-01  5.7
2011-01-01  5.9
2011-04-01  6.1
2011-07-01  6.0
2011-10-01  5.9
2012-01-01  NaN
2012-04-01  NaN
2012-07-01  NaN
2012-10-01  15.0

接着

for id in df[df.A.isnull() == True].index:
    df.loc[id, 'A'] = 1.025 * df.A.shift().loc[id] 

            A
2010-01-01  NaN
2010-04-01  NaN
2010-07-01  5.500000
2010-10-01  5.700000
2011-01-01  5.900000
2011-04-01  6.100000
2011-07-01  6.000000
2011-10-01  5.900000
2012-01-01  6.047500
2012-04-01  6.198687
2012-07-01  6.353655
2012-10-01  15.000000

现在您需要遍历要向前填充的列


推荐阅读