python - 将字符串列(2018 年 1 月)转换为 pyspark 数据帧的日期列(01-01-2018)
问题描述
我正在尝试使用 udf 函数将字符串类型列转换为日期类型列,如下所示
输入列值示例: 2018 年 1 月
预期产值: 01-01-2018
这是我的代码
from datetime import datetime
from pyspark.sql.types import DateType
squared_udf = udf(lambda z: datetime.strptime(z,'%b %Y').strftime('%Y-%m-%d'), DateType())
df = df.select('TIME PERIOD', squared_udf('TIME PERIOD'))
我的代码的输出:
DataFrame[TIME PERIOD:字符串,(TIME PERIOD):日期]
但我期待使用 TIME PERIOD 列更新火花数据框
请提出相同的建议。
解决方案
推荐阅读
- python - 在电报机器人上发送本地托管的照片
- tomcat - Tomcat - 多个用户获得相同的 sessionID
- excel - 使用 VBA 超时后打开 EXE 应用程序
- python - 包含列表列表的文本文件的连接?
- typo3 - TYPO3 FileReference 存储库查询搜索通过文件名
- python - 图中沿 x 轴的非等距点
- javascript - AssertionError [ERR_ASSERTION]:必须指定任务函数 Gulp 中的错误
- android - android AnimationDrawable 有没有快速导入工具?
- javascript - 如何添加日期格式以从下午 4 点到上午 9 点 45 分禁用按钮
- firebase - 如何将图像形式的电话上传到 Firebase 存储?