首页 > 解决方案 > 关于时间戳的 pyspark 数据框的问题

问题描述

我有一个数据框,其中一列是时间戳。

在此处输入图像描述

如何从该列以以下格式创建另一个数据框

在此处输入图像描述

我可以在这里得到一些帮助吗?

标签: pythondataframeapache-sparkpyspark

解决方案


假设您的时间戳列名称是时间:

from pyspark.sql.functions import * 
df2 = df1.withColumn('year',year('time')).withColumn('quarter',quarter('time')).withColumn('weekOfTheYear',weekofyear('time')).withColumn('dayOfTheWeek', dayofweek('time')).withColumn('dayofmonth',dayofmonth('time'))

推荐阅读