首页 > 解决方案 > 如何使用 spark scala 在两个数据框中获取最新记录?

问题描述

df1

userName | address | phone | Date
user1 | address1 | 797798 | 2020-09-15
user2 | address2 | 464665 | 2020-09-15
user3 | address3 | 123333 | 2020-09-15

Df2

userName | address | phone | Date
user2 | addresNew2 | 333333 | 2020-09-20
user1 | address1 | 44444 | 2020-09-20
user5 | address5 | 4442221 | 2020-09-20

输出::

user2 | addresNew2 | 333333 | 2020-09-20
user1 | address1 | 44444 | 2020-09-20
user5 | address5 | 4442221 | 2020-09-20
user3 | address3 | 123333 | 2020-09-15

标签: scalaapache-spark

解决方案


推荐阅读