首页 > 解决方案 > TypeError: withColumn() 正好需要 3 个参数(给定 2 个)

问题描述

我正在尝试在 Databricks 中创建 2 列,这是减去 2 列的值并添加这 2 列的值的结果。

这是我输入的代码。

dfPrep = dfCleanYear.withColumn(df.withColumn("NuevaCol", df["AverageTemperature"] - df["AverageTemperatureUncertainty"])).withColumn(df.withColumn("NuevaCol", df["AverageTemperature"] + df["AverageTemperatureUncertainty"]))
dfPrep.show()

这就是错误。

TypeError: withColumn() 正好需要 3 个参数(给定 2 个)

你知道缺少哪个论点吗?

谢谢

标签: apacheapache-spark-sqldatabricks

解决方案


目前尚不清楚您使用的是哪个 Spark 版本/口味。但是 DataBricks 文档通常对此很清楚,.withColumn调用中的第一个参数应该是 DataFrame。

示例:https ://docs.azuredatabricks.net/spark/1.6/sparkr/functions/withColumn.html

句法:

withColumn(df, “newColName”, colExpr)

参数:

df:任何 SparkR 数据帧

newColName:字符串,要添加的新列的名称

colExpr:列表达式


推荐阅读