首页 > 解决方案 > 如何提取包含多个 CSV 数据集的 ZIP 文件

问题描述

我知道,如果我们只是有 1 个包含 1 个 csv 文件的 zip 文件,我们可以简单地EXTRACT

DECLARE @file1 string = @"/input/input.csv.zip";

@file =
    EXTRACT col1 string,
            col2 string,
            col3 string
    FROM @file1
    USING Extractors.Csv(silent : true);

但是,如果我们在 1 个 zip 中有多个 csv 文件怎么办:

inputfiles.zip
-file1.csv
-file2.csv
-file3.csv

我们如何从中提取/选择inputfiles.zip

标签: azure-data-lakeu-sql

解决方案


U-SQL 无法在本地提取它,但您可以创建自己的提取器来做到这一点。

我使用了该代码并且它有效:

https://ryansimpson.net/2016/10/15/query-zipfile-adla/


推荐阅读