首页 > 解决方案 > 在 Dataframe Pyspark 中添加对数列

问题描述

我有一个数据框,我试图在其中添加一个列,该列基本上将采用同一数据框中现有列的对数。我正在尝试这个:

    df = df.withColumn("logvalue", log(df["prediction_column"]) )

我已经检查了数据框的架构,预测列是浮点类型。但我不断收到错误 TypeError: a float is required

我在这里想念什么?任何建议都会有很大帮助

标签: dataframepysparklogarithm

解决方案


您可以尝试以下方法,它对我有用

from pyspark.sql.functions import col
df = df.withColumn("logvalue", log10(col("prediction_column"))

推荐阅读