r - R:如何合并使用 spark_read_csv 加载的两个文件
问题描述
我正在处理spark_read_csv
以这种方式加载的数据:
library(sparklyr)
connection <- spark_connect(master = 'local')
all_data <- spark_read_csv(sc, "D:/my_data.csv")
在处理完这些数据后,我意识到我需要将它与另一个文件结合起来。第二个文件与第一个文件具有相同的变量和特征,我想用相同的方法加载它spark_read_csv
。
所以我的问题如下,是否可以使用该spark_read_csv
方法加载两个文件然后合并它们?目的是将一个文件已经存在的列的值添加到另一个文件中
解决方案
推荐阅读
- java - 安卓导入java库
- android - 无法访问内部类中的变量:Android Studio
- python - 在python中分解不同符号的字符串
- javascript - 在猫鼬中动态创建集合
- java - 每次完成计数后将结果添加到 int 数组
- symfony - 为什么我在 Symfony 4 WebPack 中得到“setRoutingData 不是函数”?
- bash - 期望部署 SSH 密钥的脚本不起作用
- ruby - 自动截断字符串
- jmeter - jmeter4.0_在jmeter的视图结果树中获取垃圾值作为响应
- reactjs - 如何在 AWS Amplify/AppSync React 应用程序中正确处理未经身份验证的用户和请求?