首页 > 解决方案 > 从 HDFS 加载到 S3 时如何解压缩文件?

问题描述

我有lzo格式的csv 文件,HDFS我想将这些文件加载​​到 s3 中,然后加载到雪花中,因为雪花不提供 csv 文件格式的 lzo 压缩,我需要在将这些文件加载​​到 s3 时动态转换它。

标签: hadoopsnowflake-cloud-data-platformdistcps3distcp

解决方案


您可以考虑使用 Lambda 函数在登陆 s3 时解压缩文件,这里有一个链接可以让您到达那里:

https://medium.com/@johnpaulhayes/how-extract-a-huge-zip-file-in-an-amazon-s3-bucket-by-using-aws-lambda-and-python-e32c6cf58f06


推荐阅读