首页 > 解决方案 > 如何在 Pyspark 中将两个数据集合并为一个

问题描述

假设我们有两个数据集:

数据集 1:

id  name    
1   James
2   Tom

数据集 2:

id   name
1    Bond
2    Jerry

我想要以下格式的数据集 3

数据集 3:

id   name
1    James
2    Tom
3    Bond
4    Jerry

提前致谢!!

标签: pyspark

解决方案


非常坦率的,

df3 = df1.union(df2)


推荐阅读