首页 > 解决方案 > left join 选择重复键

问题描述

销售数据框:

transaction_id, name, customer_id, amount

客户数据框:

customer_id, customer_name

我想对销售数据框执行左连接,然后对销售数据框行执行一些转换,缺少 cusomter_ids。但是,当我这样做时,

sales.join(customer,Seq("customer_id"),"left_join").select(customer("cusomter_id"))

我仍然觉得它模棱两可,我也尝试过使用 Alias,但失败了,有没有更好的方法来做同样的事情?

标签: apache-spark-sql

解决方案


推荐阅读