sql - 将列连接到 Apache Spark DataFrame 中的列列表
问题描述
spark-sql 中有没有办法在数据框中添加一个新列,例如:
- 新列包含字符串数组
- 每个字符串是另一列的值
基本上这和函数是一样的,concat
除了连接返回一个字符串列表而不是一个由标识符分隔的大字符串
注意:我正在使用 python API
解决方案
您可以使用内置array
功能。在 scala 中,这看起来像:
df
.withColumn("col_arr",array(df.columns.map(c => col(c)):_*))
推荐阅读
- opencv - 计算 PSNR 时出现异常
- mysql - 使用带有变量值的mysql python创建表
- php - 如何在 PHP 中修复“为 foreach() 提供的参数无效”
- python - 使用 Selenium 在 Instagram 弹出窗口中单击一个按钮
- python - 如何计算两个 numpy 数组之间的笛卡尔积?
- sql-server - SQL Server 动态列及其计数器
- nuxt.js - 如何使用暗模式配置 @nuxt/tailwind + 排版
- boolean - 如何测试一个条件是否为真?
- wpf - DataTransferManager 未加载电子邮件应用程序
- java - 如何在 Eclipse 中禁用错误悬停/代码挖掘