首页 > 解决方案 > 带有时间戳名称的 pySpark 输出文件

问题描述

我需要用时间戳命名我的输出文件,但出现错误。不知道我做错了什么

timestamp = spark.sql("select string(date_format(current_timestamp,'yyyy/MM/dd_HH:mm:ss'))").collect()[0][0]
print(timestamp)


Error: ADLException: Error getting info for file 
/06/05_13:14:01

如果我使用当前日期而不是时间戳,则没有错误。但我需要时间戳

标签: pysparktimestamp

解决方案


文件命名中不允许使用某些字符:

#L1234_ABC123_2020/06/05_13:14:01不是空的。尝试类似的东西#L1234_ABC123_20200605_131401,或者使用下划线_:基本上不允许使用冒号。


推荐阅读