sql - 如何仅在pyspark中将带有日期(字符串)的列转换为日期
问题描述
我有一个带有“created_at”列的数据框,其中包含如下所示的日期:
Mon Jan 27 17:16:46 +0000 2020
我想将此列日期转换为:
2020-01-27
我怎么能在 pyspark 中做到这一点?
解决方案
有关日期时间字符的更多详细信息,请参阅Jave SimpleDate 格式。
df.show(truncate=False) #sample dataframe
#+------------------------------+
#|created_at |
#+------------------------------+
#|Mon Jan 27 17:16:46 +0000 2020|
#+------------------------------+
from pyspark.sql import functions as F
df.withColumn("created_at", F.to_date("created_at","EEE MMM dd HH:mm:ss +SSSS yyyy")).show()
#+----------+
#|created_at|
#+----------+
#|2020-01-27|
#+----------+
推荐阅读
- typescript - 错误:获取https://deno.land/std@0.59.0/path/mod.ts的编译源代码失败。原因:系统找不到指定的路径。(操作系统错误 3)
- excel - 将用户窗体按钮标签链接到 VLookup 代码
- python-3.x - 如何从 Flask 中的 jinja 模板创建 PDF 文件?[标记为 pythonanywhere 的问题]
- firebase - 如何更新 firebase 数组中的地图数据?(扑)
- java - 当我已经导入了它们所在的包时,为什么还需要导入枚举类才能使用它们?[爪哇]
- r - 你可以在不声明的情况下命名一个变量吗?
- javascript - 重新渲染平面列表没有自动上传项目
- php - php cURL PATCH 请求返回数据但不更新字段
- mysql - MySQL中的迭代一个周期移位连接
- apache-kafka - 跳窗是什么意思?