pyspark - 带有时间戳名称的 pySpark 输出文件
问题描述
我需要用时间戳命名我的输出文件,但出现错误。不知道我做错了什么
timestamp = spark.sql("select string(date_format(current_timestamp,'yyyy/MM/dd_HH:mm:ss'))").collect()[0][0]
print(timestamp)
Error: ADLException: Error getting info for file
/06/05_13:14:01
如果我使用当前日期而不是时间戳,则没有错误。但我需要时间戳
解决方案
文件命名中不允许使用某些字符:
#L1234_ABC123_2020/06/05_13:14:01
不是空的。尝试类似的东西#L1234_ABC123_20200605_131401
,或者使用下划线_
。:
基本上不允许使用冒号。
推荐阅读
- python - 使用 Starlette 提供预压缩文件,当请求未压缩时,但 'accept-encoding' 包括 'gzip'
- wpf - 来自 DataTemplate 的相对数据绑定
- ruby - 厨师 - 将价值从一种资源传递到另一种资源
- javascript - 如何使用来自 url 的登录名和密码来获取请求
- intellij-idea - 我如何 grep Intellij 的构建时间通知 - 哪个日志文件有这些?
- snowflake-cloud-data-platform - 使用 SHOW_INITIAL_ROWS 参数创建的雪花流在选择时引发错误
- r - R:如果条目以字母结尾,则将上面一或两行的信息粘贴到空单元格中
- python - 在 Windows 上: :Go 构建失败并出现错误 ./go-python.h:4:10: fatal error: Python.h: No such file or directory #include "Python.h"
- python - 如何根据id的groupby从先前的测量中创建一个标记(1 - 体重减轻;0 - 相同体重a)体重减轻(8%或更多)的列?
- python - 如何在 Python 中使用带有用户输入和循环的制表模块?