python - 结合两个熊猫系列列表:1)一个包含历史时间序列,2)另一个包含预测时间序列
问题描述
这两个列表包含相同的数据系列,df_hist_list 代表历史系列,forecast_list 包含预测。我想将结果是两个组件列表的两个系列组合在一起(即 df_Cash_DF_history 和 Cash_Due_From_Banks 将整个系列组合在一起作为一个系列)。
df_hist_list=[df_Cash_DF_history,df_Int_Dep_w_Banks_history,df_Corp_Sec_history,\
df_USGovt_Agency_history,df_Muni_history,df_Unreal_G_L_history,\
...
df_Furn_Equip_Exp_history,df_Data_Proc_Exp_history,df_Promo_Exp_history,\
df_Oth_Op_Exp_history,df_ORE_Exp_history,df_Inc_Tax_Exp_history]
forecast_list=[Cash_Due_From_Banks,Int_Bear_Dep_w_Banks,Corp_Sec,USGovt_Agency,\
Muni,Unreal_Gain_Loss,RE_Loans,Pers_Loans,Ag_Loans,Bus_Loans,\
...
Emp_Ben_Exp,Occ_Exp,Furn_Equip_Exp,Data_Proc_Exp,Promo_Exp,\
Oth_Op_Exp,ORE_Exp,Inc_Tax_Exp]
df_Cash_DF_history
Out[114]:
Q1_2018 8739244.00
Q2_2018 5698279.00
Q3_2018 8849542.00
Q4_2018 1503914.00
Q1_2019 7417558.00
Q2_2019 6000285.00
Q3_2019 8697910.00
Name: TOTAL CASH & DUE FROM BANKS, dtype: object
Cash_Due_From_Banks
Out[115]:
Q3_2019 28,697,910
Q4_2019 27,810,123
Q1_2020 26,937,969
Q2_2020 26,081,183
Q3_2020 25,239,505
Q4_2020 24,412,679
Q1_2021 23,600,453
Q2_2021 22,802,580
Q3_2021 22,018,816
dtype: float64
解决方案
我假设每个 DataFrame 都有一列,而您呈现为Quarter 列的内容实际上是index。
让我们从 2 个 DataFrame 的情况开始。
要从这两个 DataFrame 中取出最左边的列,并将它们垂直连接成一个Series,请定义以下函数:
def myConcat(df1, df2):
s = pd.concat([df1.iloc[:,0], df2.iloc[:,0]])
return s[~s.index.duplicated()]
我注意到您的 2 个 DataFrame 在同一季度有一行,因此需要消除此类重复,为此我使用 了 index.duplicated()。
然后,例如,对于您提供的两个源 DataFrame,将其称为:
myConcat(df_Cash_DF_history, Cash_Due_From_Banks)
并处理 2个 DataFrames 列表并生成由 成对连接产生的Series对象列表,运行:
[ myConcat(df1, df2) for df1, df2 in zip(df_hist_list, forecast_list) ]
推荐阅读
- java - JPARepository 搜索查询返回 null
- matlab - Matlab /等待栏/进度条/GUI
- r - 在 R 中,如何使用具有定义数量的集群和每个集群内的观察值的集群抽样来重新采样以准备引导?
- rust - 如何更改采用多个值的 clap 参数中的值的名称?
- php - 基于可变数据,将一行数据带到不同的页面
- python - 使用按钮单击更改按钮文本不起作用
- java - Spark-SQL 读取 JSON 数据速度慢
- html - 如何让图像在悬停时淡出颜色?
- android - 使用二进制库运行“afl-fuzz -Q”的问题
- python - IDLE 无法打开 .py 文件并提示“该文件的编码对 Python 3.x 无效”。