首页 > 解决方案 > 如何在R中的Spark数据框连接中用变量表示列名?

问题描述

假设我的数据集中有两列:Dataset Table1

Name Eng
A 10
B 20

数据集表2

Name Maths
A 30
B 40

使用 SparkR,

table_merged = join(Table1,Table2,(table1$Name == table2$Name))

但是,如果我将列名存储在变量中

var = "Name"

执行相同操作的等效命令是什么?

标签: rjoinsparkr

解决方案


也许更容易使用“加入”之一dplyr

library(dplyr)
var = "Name"
table_merged <- left_join(Table1,Table2, by = var)

推荐阅读