pyspark - Spark Sql Pivot 问题 - 列不可迭代
问题描述
我一直在尝试在 pyspark 中旋转数据框。这样做时,我得到一个column is not iterable error. Column "find_typ_J_8" has values "J" and "8", for each VBELN_7 value, either both J and 8 types present or only one of find_type present.
这是我正在使用的示例数据框:
VBELN_7 |vbtyp_7| find_J_8|find_typ_J_8|
+----------+-------+----------+------------+
|0x0x782x3v| 7|0032101161| J|
|0n1t026y97| 7|0032645476| J|
代码:
from pyspark.sql import functions as F
tmp5.groupBy(F.col("VBELN_7"),F.col("vbtyp_7")).pivot(F.col("find_typ_J_8"), ['J', '8']).agg(F.first(F.col("find_J_8"),False))
解决方案
推荐阅读
- sql-server - 如何将服务器名称添加到 SSIS 订阅电子邮件的主题行?
- django - 您如何将内容处置实现为 django_weasyprint 包的附件?
- css - Bootstrap-sass 和 Bootstrap 创建 `Sass::UnitConversionError at / Incompatible units: 'rem' and 'px'.` 错误
- firebase - GCM 到 FCM 迁移离子 v1
- javascript - 如何在vue js中循环遍历数组中的图像数组
- java - error: reached end of file while parsing in Android Studio
- mysql - 在新的 CentOS 7 安装上正确安装 MySQL 5.7 的问题
- vim - 如何用括号替换括号但在它们之间保留内容?
- html - 在 div 中垂直居中文本:display:flex 和 align-items:center 不起作用
- python - 数据帧的 Python 嵌套字典转换为 JSON