apache-spark - Pyspark 中的案例陈述问题
问题描述
我目前正在 Pyspark 中编写此代码,但我遇到了错误,我知道这是错误的,但我不确定如何修复它。我想说的是,如果 1 则我想使用其中包含值的某个列,如果 2 则使用其中包含值的另一列,依此类推。
ABC_SCHED = ABC_SCHED.withColumn("ABC123",
F.when(F.col("MINS_TRA" == "1"), ABC_SCHED.T1_0to30)
.when(F.col("MINS_TRA" == "2"), ABC_SCHED.T2_31to60)
.when(F.col("MINS_TRA" == "3"), ABC_SCHED.T3_61to90)
.when(F.col("MINS_TRA" == "4"), ABC_SCHED.T4_91to120)
.when(F.col("MINS_TRA" == "5"), ABC_SCHED.T4_120ORMORE)
.otherwise(F.lit(None))
)
解决方案
我找到了答案!我只是在错误的地方放了括号
ABC_SCHED = ABC_SCHED.withColumn("ABC123",
F.when((F.col("MINS_TRA") == "1"), ABC_SCHED.T1_0to30)
.when((F.col("MINS_TRA") == "2"), ABC_SCHED.T2_31to60)
.when((F.col("MINS_TRA") == "3"), ABC_SCHED.T3_61to90)
.when((F.col("MINS_TRA") == "4"), ABC_SCHED.T4_91to120)
.when((F.col("MINS_TRA") == "5"), ABC_SCHED.T5_120ORMORE)
.otherwise(F.lit(None))
)
推荐阅读
- c# - 为什么我的图像在运行时变得像素化?
- html - 即使通过 CSS/CSS3 滚动,是否可以将具有绝对位置的元素“固定”到其父容器的底部?
- c# - 影子主键
- r - 无法在R中将字符转换为数字
- powershell - 启动进程 powershell 找不到指定的
- python - 无法在 anaconda 下加载 pyspark
- http - 发送 Guzzle 请求以逐项列出 api
- python - Python Pandas - 在多列左侧加入,在最终数据框中添加空白
- python - Python matplotlib - 添加趋势线,制作子图并保存为.pdf
- javascript - 我有 3 个按钮,每个按钮都有一个 JavaScript 函数,只有一个可以工作