首页 > 解决方案 > 如何更改日期格式(从 yyyy-MM-DD 到 yyyy-MM)

问题描述

我正在尝试将日期格式从更改yyyy-MM-ddyyyy-MM.

最终,我希望能够按月汇总和分组。到目前为止,我发现的唯一可行的解​​决方案是concat(year(join_data["firstVisit"]), lit("-"), month(join_data["firstVisit"])).alias('firstVisitMonth')在我的 select 语句中添加,但随后它将列作为字符串返回,我无法对其进行正确排序。

标签: pythonapache-sparkpyspark

解决方案


尝试date_format

date_format(join_data["firstVisit"], 'yyyy-MM')

推荐阅读