apache - TypeError: withColumn() 正好需要 3 个参数(给定 2 个)
问题描述
我正在尝试在 Databricks 中创建 2 列,这是减去 2 列的值并添加这 2 列的值的结果。
这是我输入的代码。
dfPrep = dfCleanYear.withColumn(df.withColumn("NuevaCol", df["AverageTemperature"] - df["AverageTemperatureUncertainty"])).withColumn(df.withColumn("NuevaCol", df["AverageTemperature"] + df["AverageTemperatureUncertainty"]))
dfPrep.show()
这就是错误。
TypeError: withColumn() 正好需要 3 个参数(给定 2 个)
你知道缺少哪个论点吗?
谢谢
解决方案
目前尚不清楚您使用的是哪个 Spark 版本/口味。但是 DataBricks 文档通常对此很清楚,.withColumn
调用中的第一个参数应该是 DataFrame。
示例:https ://docs.azuredatabricks.net/spark/1.6/sparkr/functions/withColumn.html
句法:
withColumn(df, “newColName”, colExpr)
参数:
df:任何 SparkR 数据帧
newColName:字符串,要添加的新列的名称
colExpr:列表达式
推荐阅读
- firebase - 如何在 Firestore 中使用复合查询?
- bit-src - 使用 Bit (bitsrc.io) 并将正确的文件放入 .gitignore
- javascript - 在移动/桌面版本和重定向到正确模块之间做出决定
- r - 用 seq 在 R 中做一个系列
- javascript - 选择最近的 div 中的所有复选框
- google-sheets - 如何使饼图变得不区分大小写
- c# - 自动完成仅适用于输入的第一个字符
- java - 如何在不使用 .stopAndWait 方法的情况下在 Javafx 的警报中使用按钮?
- javascript - 按钮在 Google 地图上的 infoWindow 中不起作用
- python - 如何在 python 中并行化 for 循环?