scala - 连接具有相同列的两个数据框会产生重复的列
问题描述
val renamedColsMinifiedRdd = readRddAvro.select(
column("headers"),
column("value.customer").alias("customer"),
column("value.associations").alias("associations"),
column("value.lastRefresh").alias("lastRefresh")
).limit(20)
val miniOrc = readRddOrc.select(
column("headers"),
column("customer").alias("customer"),
column("associations").alias("associations"),
column("lastRefresh").alias("lastRefresh")
).limit(20)
我有两个要合并的数据框,如下所示:
val unionedDataframes = renamedColsMinifiedRdd.unionByName(miniOrc)
但是,我的输出数据框有两个重复的列。
|-- customer: struct (nullable = true)
| |-- associationType: string (nullable = true)
|-- customer: struct (nullable = true)
| |-- associationType: string (nullable = true)
然而,我应该只有一个具有此名称的列。
解决方案
推荐阅读
- node.js - 如何通过 Swagger Cloud Endpoints 传递自签名 JWT
- linux - 根据头信息计算ELF文件的大小
- c - 找不到 pthread Eclipse GCC 链接器问题
- google-sheets - 复选框限制最大数量。根据 Google 表格中的单元格值进行选择
- ios - SwiftUI 中另一个按钮内的按钮
- javascript - 如何在 Javascript 或 JQuery 中的元素之后获取字符?
- c# - how to convert ado.net to lambda
- javascript - Three.js FBX Load Background Transparency Not Working
- r - 根据条件使用来自两个变量之一的值来改变新变量
- ios - SwiftUI - 使用文件选择器打开属于另一个 IOS 应用程序的文件,然后直接访问该文件