python - Pyspark - 转换为时间戳
问题描述
火花版本:2.1
我正在尝试将字符串日期时间列转换为格式为 utc 时间戳yyyy-mm-ddThh:mm:ss
我首先将字符串列的格式更改为yyyy-mm-ddThh:mm:ss
,然后将其转换为时间戳类型。稍后我会使用to_utc_timestamp
函数将时间戳转换为 UTC。
df.select(
f.to_timestamp(
f.date_format(f.col("time"), "yyyy-MM-dd'T'HH:mm:ss"), "yyyy-MM-dd'T'HH:mm:ss"
)
).show(5, False)
通过date_format
给我正确的格式可以正常工作。但是,当我to_timestamp
在该结果之上进行操作时,格式会更改为yyyy-MM-dd HH:mm:ss
, 而应该是yyyy-MM-dd'T'HH:mm:ss
. 为什么会这样?
有人可以告诉我如何保留 date_format 给出的格式吗?我应该怎么办?
解决方案
推荐阅读
- java - 图像未在简单 JFrame 中显示
- java - 用于部分持久性和序列化的 Java DTO 类设计?
- python - 如何模拟 python dict __str__ 方法?
- apache-kafka - 结构化流媒体中的 Spark kafka avro 制作人
- asp.net - 将 Angular 5.2 服务器端渲染发布到 IIS
- scala - scala中的高阶函数
- aws-lambda - AWS DynamoDB 之间的查询错误
- apache-spark - 火花组和序列化列表
- r - 在保留数字顺序的同时对字符值进行排序
- mongodb - 无法在 macOS 上启动 Mongodb