dataframe - 在 Dataframe Pyspark 中添加对数列
问题描述
我有一个数据框,我试图在其中添加一个列,该列基本上将采用同一数据框中现有列的对数。我正在尝试这个:
df = df.withColumn("logvalue", log(df["prediction_column"]) )
我已经检查了数据框的架构,预测列是浮点类型。但我不断收到错误 TypeError: a float is required
我在这里想念什么?任何建议都会有很大帮助
解决方案
您可以尝试以下方法,它对我有用
from pyspark.sql.functions import col
df = df.withColumn("logvalue", log10(col("prediction_column"))
推荐阅读
- python - 找不到 Flask-RESTX Jinja 模板 url
- c# - bfs 算法出错我无法理解我使用 c# unity
- laravel - Laravel - 关闭关系的过滤器集合
- python - 根据列表的值更新表中的列
- r - 在 RStudio 中更新涉及 NA 的烛台图表数据
- flutter - 为什么 Ipaymu API 发布响应总是 401?
- android - 用于将图像下载到位图中的异步任务
- telegram - 电报网络钩子“连接超时”
- c++ - 如何降低此代码的时间复杂度以找到二进制数组中连续 1 的最大数量?
- ruby-on-rails - 如何在 Rail 的 haml 文件中用大量新行声明变量?