首页 > 解决方案 > 在 Azure 数据工厂中,是否可以在不使用数据流的情况下控制大量输出文件的文件名?

问题描述

例如,我可能使用数据工厂中的复制活动将 1000 万条记录的客户表复制到 Azure 数据湖中,并在源选项中使用“动态范围”的分区选项。我的理解是,这将导致数据工厂将数据拆分为湖中的大量文件。

使用这种方法,我如何为湖中的输出文件强制命名约定?例如,每个文件名都以“cust_”开头,这意味着文件将被称为 cust_1、cust_2、cust_3、cust_4 等。

标签: azure-data-factoryazure-data-factory-2azure-data-factory-pipeline

解决方案


我的理解是“动态范围”的分区选项用于将文件拆分为多个文件,然后执行异步复制。这是提高复制速度的多线程操作。它是复制活动性能优化功能。我认为这不是您想要的文件拆分。

  1. 在源设置中选择“无”。 在此处输入图像描述

  2. 我们可以在接收器设置中设置“文件扩展名”、“每个文件的最大行数”和“文件名前缀”。 在此处输入图像描述

  3. 在我这边,ADF 会自动拆分成多个文件,每个文件包含 50 行记录。 在此处输入图像描述


推荐阅读