首页 > 解决方案 > 如何使用 Azure DataFactory 解压缩 rar 文件

问题描述

我们有一个新客户,在登陆项目时,我们给了他们一个 blob 存储空间让他们留下文件,以便我们以后可以自动化和处理信息。

我们的想法是使用 Azure Datafactory,但我们找不到处理 .rar 文件的方法,甚至 .zip(来自 Windows 的文件)也给我们带来了麻烦。而且由于是客户端提供 .rar 格式,因此我们希望绝对确保在要求他们更改它之前没有任何方法可以处理,或者为了转换文件而部署数据块或类似服务。

有没有办法从 blob 存储中获取 .rar 文件,解压缩,然后处理它?

我一直在寻找这样的帖子相关的官方文档,我们最接近的是使用 ZipDeflate,但它似乎不能满足我们的要求。

提前致谢!

标签: azurecompressionazure-data-factoryazure-data-factory-2

解决方案


仅支持数据工厂压缩的类型是 GZip、Deflate、BZip2 和 ZipDeflate。

对于不支持的文件类型和压缩格式,数据工厂为我们提供了一些解决方法:

可以使用 Azure 数据工厂的可扩展性功能来转换不受支持的文件。两个选项包括 Azure Functions 和使用 Azure Batch 的自定义任务。

您可以查看使用 Azure 函数提取 tar 文件内容的示例。有关详细信息,请参阅Azure Functions 活动

您还可以使用自定义 dotnet 活动构建此功能。更多信息可在此处获得。

接下来,您可能需要弄清楚如何使用 Azure 函数来提取 rar 文件的内容。


推荐阅读