python - 使用 dataframe.withColumn 和变量似乎不起作用
问题描述
我正在尝试编写如下语句:profileId = "some value" df.withColumn("ProfileId", col(profileId)) 并在 DataBricks 上收到 AnalysisException。据我所知,这应该可以工作,所以我想知道问题出在哪里。任何帮助,将不胜感激。
解决方案
尝试lit
与变量一起使用,例如
%py
from pyspark.sql.functions import col, expr, when, lit
df = sc.parallelize([
("orange", "apple"), ("kiwi", None), (None, "banana"),
("mango", "mango"), (None, None)
]).toDF(["fruit1", "fruit2"])
profileId = "some value"
display(df.withColumn("ProfileId", lit(profileId)))
推荐阅读
- python - 为什么最好的损失没有更新?
- reactjs - _React$useContext 在 app.js 组件上未定义
- spring - Spring boot @Query 在视图调用时忽略 @Table
- python - 使用带有 pyspark 数据框的 h3 库
- java - non-capturing group still shows?
- sql - 如何在sql中添加列并使用大小写填充?
- tcl - Fetch a line containing a word and some value in Tcl
- javascript - Call async getAllData from systeminformation in child process and retrieve it in main thread
- python - Conversion RGB into LAB for multiple values
- php - How to change time in Debian by Website PHP?