pyspark - 如何在 AWS Glue 中将字符串转换为日期
问题描述
我在 AWS S3 中有一个 csv 文件,当我执行爬虫时,带有日期的字段01/01/2016 04.21
被视为 AWS 胶水中的字符串。
如何将其更改为日期类型?
我尝试使用 AWS Glue 中的“修改架构”按钮,但它最终有一个空白字段。
解决方案
将动态帧转换为 Pyspark 数据帧并将 Pyspark 用于所有内容。更轻松:
from pyspark.sql.functions import from_unixtime, unix_timestamp, col
df= dyf.toDF()
df = df.withColumn(col(columnname), from_unixtime(unix_timestamp(col(columnname),"dd/MM/yyyy hh.mm")))
推荐阅读
- c++ - 为什么不能将作为常量引用传递给函数的数组的 .size() 用作模板参数?
- node.js - 在 nextjs 自定义服务器上保存上传的文件
- python - 熊猫与子集的滚动相关性
- javascript - 使用 Javascript 按下按钮时更改 html 中的多个文本
- asp.net-core - 获取“ InvalidOperationException:验证服务描述符'ServiceType:MediatR.IRequestHandler`2时出错”
- python - 我正在尝试创建一个视频游戏,但我被卡住了
- bert-language-model - 如何微调孟加拉语的伯特语言模型
- javascript - 我有一个标题为:“TypeError:无法读取未定义的属性‘执行’”并且无法修复它的错误
- javascript - 为什么 JS 代码中的这个 javascript 函数以这样的前括号开头并以一对括号结尾?(功能() { })();
- html - 附加到文本框及其大小的 HTML 复选框