首页 > 解决方案 > Python PySpark:从日期列中减去整数列错误:列对象不可调用

问题描述

我正在使用 PySpark。我有一列是日期数据类型列,另一列是整数数据类型列。

请参阅下面的示例:

date         subtract
2019-01-08   7
2019-01-04   2

我想创建一个名为“new_date”的新列,它从“日期”列中减去“减去”列值。

以下是我想要的输出:

date         subtract  new_date   
2019-01-08   7         2019-01-01
2019-01-04   2         2019-01-02

我尝试了下面的代码:

df = df.withColumn('new_date', F.date_sub(df.date, df.subtract))

下面是我得到的错误: TypeError: 'Column' object is not callable

标签: pythondatepysparkintegersubtraction

解决方案


尝试这个:

df.withColumn("new_date", F.expr("date_sub(date, subtract)"))

推荐阅读