google-cloud-platform - Gsutil 在存储桶中创建“tmp”文件
问题描述
我们正在使用自动化脚本将数千个文件从 MAPR HDFS 上传到 GCP 存储。有时主存储桶中的文件带有tmp~!@
后缀,这会导致我们的管道失败。
例子:
gs://some_path/.pre-processing/file_name.gz.tmp~!@
我们正在使用rsync -m
并且在某些情况下cp -I
some_file | gsutil -m cp -I '{GCP_DESTINATION}'
gsutil -m rsync {MAPR_SOURCE} '{GCP_DESTINATION}'
复制尝试可能失败并稍后从另一台机器重试,最终,我们同时拥有该文件和另一个带有tmp~!@
后缀的文件
我想摆脱这些文件而不主动寻找它们。
我们有 gsutil 4.33,感谢任何线索。谢谢
解决方案
推荐阅读
- python - 如何在 Keras DQN 中实现梯度上升
- rest - 用于 Google Fit REST 心率查询的数据源 ID 是什么?
- python-3.x - 通过 QTableWidget 上的动态按钮更新和删除 MySQLite 数据库
- android - 尝试从 Android 应用程序 Chromecast URL 时如何检测 URL 错误?
- typescript - Vue.js 数据变量不存在
- python - 在不使用numpy的情况下查找矩阵中所有行的列总和
- php - Laravel PHP在数组中获取值
- apache-spark - Pyspark JDBC 中的谓词不进行分区读取
- c - 从链表中删除元素(如果找到)而不从内存中删除它
- python - 从heroku获取环境变量