首页 > 解决方案 > 在 Azure 数据工厂中解压缩 gzip 文件

问题描述

我想知道是否可以在 ADF 中设置一个源和病态,它将解压缩 gzip 文件并显示提取的 txt 文件。发生的事情是在源/接收器都有 gzip 压缩的地方错误地定义了接收器。

所以最终结果是“fil1.gz”现在是“file1.gz.gz”。

这是文件在 Azure blob 中的外观: 在此处输入图像描述

这是文件在 S3 存储桶中的样子(结尾被切断,但结尾是“txt.gz”): 在此处输入图像描述

我看到在 COPY 中有 Zipdeflate 和 deflate 压缩,但我得到一个错误,它不支持这种类型的活动。

我在尝试解压缩的 ADF 管道中创建了一个接收器。在数据源屏幕中,我使用了 Zipdeflate,但它使用“deflate”扩展名放置文件名,而不是“txt”。

在此处输入图像描述

谢谢

标签: azure-data-factory

解决方案


创建一个“复制数据”对象来源:由于您的扩展名是gz,您应该选择GZip作为压缩类型,勾选二进制复制目标:Blob Storage Binary compression-none

这样的复制管道将解压缩您的文本文件


推荐阅读