首页 > 解决方案 > 分块读取压缩的 S3 对象

问题描述

我目前有一些代码正在使用 boto3 通过使用s3_object.get()["Body"].iter_lines(). 有什么方法可以用 gzip 压缩的文本文件做类似的事情吗?我见过诸如https://stackoverflow.com/a/59635286/177333之类的示例,但据我所知,他们将整个文件加载到内存中。有没有办法分块做到这一点?我希望 boto3 能够检测到 gzip 标头并自动执行,但是在尝试解码时我得到了预期的UnicodeDetectError: 'utf-8' codec can't decode byte 0x8b in position 1错误。

标签: boto3python-3.7

解决方案


推荐阅读