python - 如何组合两个 Pandas 数据框,同时将两者的列保留在新数据框中?
问题描述
在这种情况下,我想结合revenue_df
and total_df
。
revenue_df : https://i.stack.imgur.com/652KT.png <br>
total_df: https://i.stack.imgur.com/44j6A.png
我设法这样做,.merge()
如下所示:
但是,新合并的数据框仅包含 fromrevenue_df
而不是 from 的列total_df
。这可以防止我引用total_df's
合并数据框中的列。
revenue_df.info()
显示了这一点:
有没有一种方法可以合并两个数据框并在合并的数据框中获取两个数据框的列?
解决方案
revenue_df.alias('df1').join(total_df.alias('df2'),on = df1['Year'] == df2['Year'],how = 'outer').select('df1.*','df2.*')
使用 join 我们可以从两个数据框中选择所有列。我们还可以限制要获取的列。
推荐阅读
- java - 插入关系表时,房间多对多关系 UNIQUE 约束失败
- sql - 无法在 BigQuery 中选择列
- xquery - 如何在不同元素中的数据的构面内获取单行数据
- python - 如何将项目附加到对象数组?
- c# - 散列密码显示奇怪
- javascript - PHP:如何先使用变量,然后在 PHP 中初始化它(使用 Jquery 或 Ajax)?
- python - AWS Glue 调用 o128.resolveChoice 时出错
- r - 从 github 安装 flipMaxDiff 包时出错
- sql - “在不存在的地方插入”是否包括在同一插入处插入的记录
- iot - LoRaWAN 规划 - M 个网关是否足以满足 N 个传感器和 1 个 [msg/hr] 的需求?