azure - 如何使用 Azure DataFactory 解压缩 rar 文件
问题描述
我们有一个新客户,在登陆项目时,我们给了他们一个 blob 存储空间让他们留下文件,以便我们以后可以自动化和处理信息。
我们的想法是使用 Azure Datafactory,但我们找不到处理 .rar 文件的方法,甚至 .zip(来自 Windows 的文件)也给我们带来了麻烦。而且由于是客户端提供 .rar 格式,因此我们希望绝对确保在要求他们更改它之前没有任何方法可以处理,或者为了转换文件而部署数据块或类似服务。
有没有办法从 blob 存储中获取 .rar 文件,解压缩,然后处理它?
我一直在寻找这样的帖子和相关的官方文档,我们最接近的是使用 ZipDeflate,但它似乎不能满足我们的要求。
提前致谢!
解决方案
仅支持数据工厂压缩的类型是 GZip、Deflate、BZip2 和 ZipDeflate。
对于不支持的文件类型和压缩格式,数据工厂为我们提供了一些解决方法:
可以使用 Azure 数据工厂的可扩展性功能来转换不受支持的文件。两个选项包括 Azure Functions 和使用 Azure Batch 的自定义任务。
您可以查看使用 Azure 函数提取 tar 文件内容的示例。有关详细信息,请参阅Azure Functions 活动。
您还可以使用自定义 dotnet 活动构建此功能。更多信息可在此处获得。
接下来,您可能需要弄清楚如何使用 Azure 函数来提取 rar 文件的内容。
推荐阅读
- javascript - 在 AWS Cognito 中按用户名搜索用户
- html - 网格内容与网格布局不匹配
- python - 如何安装 scikit-image 0.14 版本?
- ios - 如何将 json 解码为键中有空格的结构/类对象?
- r - 如何在 R Highcharter 中将完整数据导出为 CSV
- mysql - flask/mysql 应用程序部署在 heroku 中。cleardb 已激活。我现在如何让烧瓶创建数据库?
- html - 实现一个事件绑定,以便当用户在表单上输入邮政编码时,它会根据输入的邮政编码自动填写城市
- sympy - Sympy:防止评估下标符号
- sql - 基于JSON数组子元素的查询
- r - 如果在重复的相同非 NA 值之间,用最后一个非 NA 填充 NA 值