首页 > 解决方案 > Spark sql - Pyspark 字符串到日期的转换

问题描述

我有一列包含20180501字符串格式的数据,我想将其转换为日期格式,尝试使用

to_date(cast(unix_timestamp('20180501', 'YYYYMMDD') as timestamp))'

但它仍然没有奏效。我正在使用带有数据框的 Spark SQL

标签: apache-sparkpysparkapache-spark-sqlpyspark-sql

解决方案


格式应为yyyyMMdd

spark.sql("SELECT to_date(cast(unix_timestamp('20180501', 'yyyyMMdd') as timestamp))").show()
# +------------------------------------------------------------------+
# |to_date(CAST(unix_timestamp('20180501', 'yyyyMMdd') AS TIMESTAMP))|
# +------------------------------------------------------------------+
# |                                                        2018-05-01|
# +------------------------------------------------------------------+

推荐阅读