r - 如何在R中的Spark数据框连接中用变量表示列名?
问题描述
假设我的数据集中有两列:Dataset Table1
Name Eng
A 10
B 20
数据集表2
Name Maths
A 30
B 40
使用 SparkR,
table_merged = join(Table1,Table2,(table1$Name == table2$Name))
但是,如果我将列名存储在变量中
var = "Name"
执行相同操作的等效命令是什么?
解决方案
也许更容易使用“加入”之一dplyr
library(dplyr)
var = "Name"
table_merged <- left_join(Table1,Table2, by = var)