首页 > 解决方案 > 需要在pyspark中将字符串yyyymmdd转换为日期yyyymmdd格式

问题描述

是否可以将 '20190622' 字符串类型更改为 20190622 日期类型?

df = spark.createDataFrame([('20190622',)], ['t'])
df.printSchema()
root
|-- t: string (nullable = true)
df1 = df.select(F.to_date(df.t, 'yyyyMMdd').alias('dt'))

当我更改格式时,它会更改格式。df1.printSchema() root |-- dt: date (nullable = true)

df1.show()
+----------+ 
|        dt|
+----------+
|2019-06-22|
+----------+  

日期数据类型的预期输出 20190622。

标签: pythonapache-sparkpysparkapache-spark-sql

解决方案


推荐阅读