首页 > 解决方案 > 如何组合两个 Pandas 数据框,同时将两者的列保留在新数据框中?

问题描述

在这种情况下,我想结合revenue_dfand total_df

revenue_df : https://i.stack.imgur.com/652KT.png <br>
total_df: https://i.stack.imgur.com/44j6A.png

我设法这样做,.merge()如下所示:

组合数据框

但是,新合并的数据框仅包含 fromrevenue_df而不是 from 的列total_df。这可以防止我引用total_df's合并数据框中的列。

revenue_df.info()显示了这一点:

有没有一种方法可以合并两个数据框并在合并的数据框中获取两个数据框的列?

标签: pythonpandasdataframe

解决方案


revenue_df.alias('df1').join(total_df.alias('df2'),on = df1['Year'] == df2['Year'],how = 'outer').select('df1.*','df2.*')

使用 join 我们可以从两个数据框中选择所有列。我们还可以限制要获取的列。


推荐阅读