首页 > 解决方案 > 将月份添加到熊猫数据框中的日期变量

问题描述

我有一个熊猫数据框,如下所示:

import pandas as pd
df = pd.DataFrame({'date1':['12/1/2019','12/1/2019','12/1/2019'], 'nb_months':[11,11,12]})
df['date1'] = pd.to_datetime(df['date1'], format='%m/%d/%Y', errors='coerce').dropna()
df

    date1       nb_months
0   2019-12-01  11
1   2019-12-01  11
2   2019-12-01  12

我想将 nb_months 添加到 date1 列。我确实尝试了下面的代码,但输出不是我所期望的。下面的代码给了我 1 个之前的日期作为输出(例如第一行:date3 应该是 2019-12-01 + 11 个月 = 2020-11-01而我得到2020-10-31。

df['date3'] = df.apply(lambda x: x['date1'] + pd.offsets.MonthEnd(x['nb_months']), axis=1)
df

    date1       nb_months   date3
0   2019-12-01  11          2020-10-31
1   2019-12-01  11          2020-10-31
2   2019-12-01  12          2020-11-30

我的预期输出:

    date1       nb_months   date3
0   2019-12-01  11          2020-11-01
1   2019-12-01  11          2020-11-01
2   2019-12-01  12          2020-12-01

标签: pandaspython-3.6

解决方案


我认为您想要MonthBegin,而不是MonthEnd,以便在每个月的第一天获得新的日期。这是您的示例的略微修改版本:

# set up the data frame
df = pd.DataFrame(
    {'date1': ['12/1/2019', '12/2/2019', '12/2/2019', '12/3/2019', '12/31/2019'], 
     'nb_months': [0, 1, 2, 3,  0]})

df['date1'] = pd.to_datetime(
    df['date1'], format='%m/%d/%Y', errors='coerce').dropna()

# apply the offsets
df['date3'] = df.apply(
    lambda x: x['date1'] + pd.offsets.MonthBegin(x['nb_months']), axis=1)

print(df)


       date1  nb_months      date3
0 2019-12-01          0 2019-12-01
1 2019-12-02          1 2020-01-01
2 2019-12-02          2 2020-02-01
3 2019-12-03          3 2020-03-01
4 2019-12-31          0 2020-01-01

推荐阅读