python - Python PySpark:从日期列中减去整数列错误:列对象不可调用
问题描述
我正在使用 PySpark。我有一列是日期数据类型列,另一列是整数数据类型列。
请参阅下面的示例:
date subtract
2019-01-08 7
2019-01-04 2
我想创建一个名为“new_date”的新列,它从“日期”列中减去“减去”列值。
以下是我想要的输出:
date subtract new_date
2019-01-08 7 2019-01-01
2019-01-04 2 2019-01-02
我尝试了下面的代码:
df = df.withColumn('new_date', F.date_sub(df.date, df.subtract))
下面是我得到的错误: TypeError: 'Column' object is not callable
解决方案
尝试这个:
df.withColumn("new_date", F.expr("date_sub(date, subtract)"))
推荐阅读
- visual-studio-code - 如何在 vscode 中禁用受限模式功能和/或横幅
- shell - 如何查找和计算文件类型
- c# - 如何在 .NET Core 3.1 的 Directory.Build.props 中获取 Windows 版本?
- c++ - SDL_CreateTextureFromSurface 然后 SDL_UpdateTexture 弄乱颜色
- sql - 在 postgresql 中标记日期格式的案例语句
- javascript - 如何将 react 导入我的 background.js chrome 扩展
- sql - 如何在 SQL Server 中重命名数据库?
- laravel - Laravel src/Controllers/StatisticsController.php 找不到路径
- css - 如何在 SASS 中生成动态变量
- android - 线程“主”java.lang.NoClassDefFoundError 中的异常:javax/xml/bind/annotation/XmlSchema EXCEPTION