amazon-s3 - 从谷歌云存储到 s3 的 gsutil rsync 挂在大文件上
问题描述
尝试使用以下命令将我的谷歌云存储桶备份到 aws s3 桶时,我遇到了较大文件 (560MB) 的挂起:
gsutil -m rsync -rd gs://<MyGoogleBucket>/ s3://<MyS3Bucket>/
我知道连接很好,因为它复制了大约 150 个较小的文件 (9MB),然后它挂在较大的文件上,没有明显的错误消息,只是外壳中的一个挂起的进度条。
当我按 ctrl-C 退出程序时,我注意到几条消息说:
[Errno 104] Connection reset by peer
这是我的 gsutil 版本:
gsutil version: 4.38
checksum: 58d3e78c61e7e0e80813a6ebc26085f6 (OK)
boto version: 2.49.0
python version: 2.7.13 (default, Sep 26 2018, 18:42:22) [GCC 6.3.0 20170516]
OS: Linux 4.9.0-8-amd64
multiprocessing available: True
using cloud sdk: True
pass cloud sdk credentials to gsutil: True
config path(s): /etc/boto.cfg, /home/USER/.boto
gsutil path: /home/USER/google-cloud-sdk/bin/gsutil
compiled crcmod: True
installed via package manager: False
editable install: False
我曾尝试在我的云 shell 以及 Google Compute VM 上执行此操作
有谁知道这个问题的修复或解决方法?提前致谢
-内森
解决方案
我已经开始使用 rclone,它简化了过程并允许完成复制。您可以在此处找到有关使用此工具的信息: https ://rclone.org/docs/
-n
推荐阅读
- apache-kafka - 将同一个 Kafka 主题的事件下沉到 GCS 中的多个路径中
- c# - 匹配图像上的不规则网格而不剪切对象
- python - 在python中安装街机包的问题
- django - Django:来自另一个模型的参考模型字段
- d3.js - 是否可以使用 ElasticY 左轴和定义的右轴域?
- azure - Azure 数据工厂无法检索输出
- python - face_recognition 库需要很长时间执行,我也尝试使用 Numba 但我无法执行,如何优化以下代码?
- python - Python statsmodels Probit 和 Logit 产生错误,而 OLS 工作正常?
- c# - 如果在数组中找到 C# Linq 表达式,则从字符串中删除
- python - 如何对没有来源的图像进行网络抓取?