scala - 在 Spark Scala 的数据框列中爆炸元组数组
问题描述
我想从数据框中分解 Array[(Int, Int)] 列
输入:
colA newCol
1 [[1a, 2],[3c, 5u]]
2 [[1c, 9m], [5e, 7l]]
输出:
colA newCol
1 1a
1 3c
2 1c
2 5e
解决方案
这是我的方法。
+----+--------------------+
|col1|col2 |
+----+--------------------+
|1 |[[1a, 2b], [3c, 5u]]|
|2 |[[1c, 9m], [5e, 7l]]|
+----+--------------------+
这是您的数据框和
df.withColumn("t", explode($"col2")).selectExpr("col1", "t[0]").show
我的代码结果
+----+----+
|col1|t[0]|
+----+----+
| 1| 1a|
| 1| 3c|
| 2| 1c|
| 2| 5e|
+----+----+
推荐阅读
- javascript - 从日期时间选择器到验证
- three.js - 使用 Three.js 将边缘线添加到 3D 对象
- c# - POST 请求期间未调用自定义 500 错误页面
- java - Prometheus 每天对特定 Spring 控制器端点的请求计数
- swiftui - 问题:如何从 SceneDelegate 调用 SwiftUI 视图结构方法
- c# - 没有注销身份验证处理程序已注册 asp.net 核心
- oauth-2.0 - GooglePlusAPI 返回错误“项目中未使用旧版人员 API”
- terraform - 此对象没有名为 ca_public_key_pem 的参数、嵌套块或导出属性
- sql-server - 通过 1 个公共列合并来自两个表的结果
- php - PHP 表单不会插入 MYSQL