首页 > 解决方案 > 如何在 Azure 数据工厂 v2 中解压缩 zip 文件

问题描述

我正在尝试使用 Azure 数据工厂 v2 解压缩一个 zip 文件(其中包含多个文件)。zip 文件位于 Azure 文件存储中。ADF 复制任务只是复制原始 zip 文件而不解压缩它。关于如何使这项工作的任何建议?

这是当前配置:

  1. zip 文件源设置为压缩类型 = ZipDeflate 的二进制数据集。
  2. 目标文件夹也设置为二进制数据集,但压缩类型 = 无。
  3. 创建了具有单个复制任务的管道以将文件从 zip 文件移动到目标文件夹。

标签: zipunzipazure-data-factory-2

解决方案


这可以通过在源数据集和复制活动的接收器数据集中设置“ZipDeflate”压缩类型来实现,您不需要指定任何压缩配置(压缩类型为“无”)。

在此处输入图像描述

在复制活动接收器设置中,请将复制行为设置为“Flatten Hierarchy”以解压缩并写入单个文件。

在此处输入图像描述

当复制行为设置为“Flatten Hierarchy”时,通过将文件重命名为 data_SomeGUID.csv,将提取压缩源文件中的所有文件并将其作为单个文件写入接收器数据集中提到的目标文件夹。

如果您未在复制活动中指定复制行为(设置为“无”),则它会解压缩 ZipDeflate 文件并写入基于文件的接收器数据存储,文件将被提取到文件夹://。

请参阅此文档以了解 Azure 数据工厂中的压缩支持:https ://docs.microsoft.com/azure/data-factory/supported-file-formats-and-compression-codecs-legacy#compression-support


推荐阅读