首页 > 解决方案 > 使用基于分隔符的 Azure 数据工厂拆分文件

问题描述

我对 ADF 很陌生,我有点坚持以下用例:

我想根据分隔符将一个大文件拆分为多个较小的文件。在某些行之后会有一个分隔符。例如,以下是输入文件内容:

row1content
row2content
row3content
-----
row4content
row5content
-----
row6content
row7content
row8content
row9content
-----
row10content
row11content
row12content

-----是我想将一个文件拆分为多个较小文件作为输出的分隔符​​,并将它们命名为 MyFile1、MyFile2、MyFile3、MyFile4 等,使其内容如下(根据分隔符拆分):

我的文件 1:

row1content
row2content
row3content

我的文件2

row4content
row5content

我的文件 3:

row6content
row7content
row8content
row9content

我的文件4:

row10content
row11content
row12content

我正在尝试使用 ADF 中的数据流来实现它。输入/输出文件的源和目标将是 azure blob 存储。如果有人能指出我可以进一步进行的方向或来源,那将非常有帮助。

标签: azureazure-functionsazure-blob-storageazure-data-factoryazure-data-factory-2

解决方案


推荐阅读