python - 基于公共列将数据框与另一列中的列连接起来
问题描述
我有两个 pyspark 数据框:
| A | B | C |
| 21 | 999 | 1000|
| 22 | 786 | 1978|
| 23 | 345 | 1563|
和
| A | D | E |
| 21 | aaa | a12 |
| 22 | bbb | b43 |
| 23 | ccc | h67 |
期望的结果:
| A | B | C | E |
| 21 | 999 | 1000| a12 |
| 22 | 786 | 1978| b43 |
| 23 | 345 | 1563| h67 |
我尝试使用join,甚至df1.join(df2.E, df1.A == df2.A)
无济于事。
解决方案
当您尝试使用该函数加入 2 个数据框时,join
它需要 3 个参数。
- arg-1 :您需要加入的另一个数据框。
- arg-2 :您需要加入数据框的列。
- arg-3 :您要执行的连接类型。默认情况下它的内部连接。
PFB 示例代码。
df1.join(df2, df1.id == df2.id, 'outer')
您可以在此处找到更多详细信息。
问候,
尼拉吉
推荐阅读
- javascript - Gatsby - wrapPageElement 中的布局不更新状态
- javascript - Jquery blur 事件监听器只激活一次
- c++ - 如何存储值以供以后使用?
- python - OpenCV 帧到 FFMPEG
- azure - Azure Batch Pool 卡在启动任务上
- autodesk-forge - 如何为模型制作放置工具?
- python - 我使用 for 循环创建了一个函数,用于在字典中显示和添加项目。我的代码看起来不错吗?我应该采取不同的做法吗?
- html - 如何在 View/Scroll 上触发 CSS 动画?
- asp.net-core - API 网关 Ocelot 和 Kubernetes
- xamarin - 如何在 Xamarin 表单中延迟几秒随机图像并显示到 XAML 中?