首页 > 解决方案 > 结合两个熊猫系列列表:1)一个包含历史时间序列,2)另一个包含预测时间序列

问题描述

这两个列表包含相同的数据系列,df_hist_list 代表历史系列,forecast_list 包含预测。我想将结果是两个组件列表的两个系列组合在一起(即 df_Cash_DF_history 和 Cash_Due_From_Banks 将整个系列组合在一起作为一个系列)。

df_hist_list=[df_Cash_DF_history,df_Int_Dep_w_Banks_history,df_Corp_Sec_history,\
              df_USGovt_Agency_history,df_Muni_history,df_Unreal_G_L_history,\
              ...
              df_Furn_Equip_Exp_history,df_Data_Proc_Exp_history,df_Promo_Exp_history,\
              df_Oth_Op_Exp_history,df_ORE_Exp_history,df_Inc_Tax_Exp_history]


forecast_list=[Cash_Due_From_Banks,Int_Bear_Dep_w_Banks,Corp_Sec,USGovt_Agency,\
               Muni,Unreal_Gain_Loss,RE_Loans,Pers_Loans,Ag_Loans,Bus_Loans,\
               ...
               Emp_Ben_Exp,Occ_Exp,Furn_Equip_Exp,Data_Proc_Exp,Promo_Exp,\
               Oth_Op_Exp,ORE_Exp,Inc_Tax_Exp]

df_Cash_DF_history
Out[114]: 
Q1_2018    8739244.00
Q2_2018    5698279.00
Q3_2018    8849542.00
Q4_2018    1503914.00
Q1_2019    7417558.00
Q2_2019    6000285.00
Q3_2019    8697910.00
Name: TOTAL CASH & DUE FROM BANKS, dtype: object

Cash_Due_From_Banks
Out[115]: 
Q3_2019   28,697,910
Q4_2019   27,810,123
Q1_2020   26,937,969
Q2_2020   26,081,183
Q3_2020   25,239,505
Q4_2020   24,412,679
Q1_2021   23,600,453
Q2_2021   22,802,580
Q3_2021   22,018,816
dtype: float64

标签: pythonpandasseries

解决方案


我假设每个 DataFrame 都有一列,而您呈现为Quarter 列的内容实际上是index

让我们从 2 个 DataFrame 的情况开始。

要从这两个 DataFrame 中取出最左边的列,并将它们垂直连接成一个Series,请定义以下函数:

def myConcat(df1, df2):
    s = pd.concat([df1.iloc[:,0], df2.iloc[:,0]])
    return s[~s.index.duplicated()]

我注意到您的 2 个 DataFrame 在同一季度有一行,因此需要消除此类重复,为此我使用 了 index.duplicated()

然后,例如,对于您提供的两个源 DataFrame,将其称为:

myConcat(df_Cash_DF_history, Cash_Due_From_Banks)

并处理 2个 DataFrames 列表并生成 成对连接产生的Series对象列表,运行:

[ myConcat(df1, df2) for df1, df2 in zip(df_hist_list, forecast_list) ]

推荐阅读