azure-data-factory - 在 Azure 数据工厂中解压缩 gzip 文件
问题描述
我想知道是否可以在 ADF 中设置一个源和病态,它将解压缩 gzip 文件并显示提取的 txt 文件。发生的事情是在源/接收器都有 gzip 压缩的地方错误地定义了接收器。
所以最终结果是“fil1.gz”现在是“file1.gz.gz”。
这是文件在 S3 存储桶中的样子(结尾被切断,但结尾是“txt.gz”):
我看到在 COPY 中有 Zipdeflate 和 deflate 压缩,但我得到一个错误,它不支持这种类型的活动。
我在尝试解压缩的 ADF 管道中创建了一个接收器。在数据源屏幕中,我使用了 Zipdeflate,但它使用“deflate”扩展名放置文件名,而不是“txt”。
谢谢
解决方案
创建一个“复制数据”对象来源:由于您的扩展名是gz,您应该选择GZip作为压缩类型,勾选二进制复制目标:Blob Storage Binary compression-none
这样的复制管道将解压缩您的文本文件
推荐阅读
- ios - 合并后视频旋转问题
- javascript - JS中如何访问数组中的对象中的数组?
- java - 休眠单向一对多关系给了我stackoverflow异常
- javascript - Vue.js 数据表仅显示第一列中的数据
- node.js - Heroku 部署问题
- android - How to save a part of firebase realtime database in offline mode
- python - 如何使 pytest 驱动程序实例在我的测试用例中可用
- java - Collections.sort 通用方法签名
- c++ - 计算先前对齐的地址
- ios - 应用程序在 Xcode 模拟器中显示加密数据,但在 TestFlight 中不显示