zip - 如何在 Azure 数据工厂 v2 中解压缩 zip 文件
问题描述
我正在尝试使用 Azure 数据工厂 v2 解压缩一个 zip 文件(其中包含多个文件)。zip 文件位于 Azure 文件存储中。ADF 复制任务只是复制原始 zip 文件而不解压缩它。关于如何使这项工作的任何建议?
这是当前配置:
- zip 文件源设置为压缩类型 = ZipDeflate 的二进制数据集。
- 目标文件夹也设置为二进制数据集,但压缩类型 = 无。
- 创建了具有单个复制任务的管道以将文件从 zip 文件移动到目标文件夹。
解决方案
这可以通过在源数据集和复制活动的接收器数据集中设置“ZipDeflate”压缩类型来实现,您不需要指定任何压缩配置(压缩类型为“无”)。
在复制活动接收器设置中,请将复制行为设置为“Flatten Hierarchy”以解压缩并写入单个文件。
当复制行为设置为“Flatten Hierarchy”时,通过将文件重命名为 data_SomeGUID.csv,将提取压缩源文件中的所有文件并将其作为单个文件写入接收器数据集中提到的目标文件夹。
如果您未在复制活动中指定复制行为(设置为“无”),则它会解压缩 ZipDeflate 文件并写入基于文件的接收器数据存储,文件将被提取到文件夹://。
请参阅此文档以了解 Azure 数据工厂中的压缩支持:https ://docs.microsoft.com/azure/data-factory/supported-file-formats-and-compression-codecs-legacy#compression-support
推荐阅读
- r - 每个值的列中返回值 = 给定月份
- python - 删除python集中的部分字符串
- python - 用列表中的唯一值替换数据框中列中的 NAN 值?
- django - 在 django 中,我无法理解包含函数的工作原理
- mysql - 在 MongoDB 中的同一查询中查找和计数
- html - 在 svg 中居中文本
- android - Compose 运行时中的 `isLiveLiteralsEnabled` 函数是什么,如何禁用它?
- pandas - 如何决定是保留重复行还是删除它们。我有两条重复的记录,但它们指的是两个不同的人
- node.js - 命名空间“NodeJS”没有导出成员“Require”
- excel - 饼图的 SerieCollection(1).Point(2)“参数无效”问题