首页 > 解决方案 > Azure 数据工厂:架构更改

问题描述

我有一个具有以下格式的 blob。第一行提供标题详细信息,接下来的 2 行作为数据记录,最后一行作为包含数据记录计数的尾部记录。在记录文件时,我想将我的架构定义为单个字段,一旦我删除了我的拖车记录,我想用“|”将它转换为正确的架构格式 作为分隔符。你能让我知道我怎样才能做到这一点吗?

DeptID|DeptNAme
1|A
2|B
2

在此先感谢库马尔

标签: azure-data-factory-2

解决方案


更新:

  1. SurrogateKey1Step4前面提到的活动之后,我们可以使用Select活动来选择列DeptID|DeptNAme在此处输入图像描述

  2. 然后我们可以使用DerivedColumn1活动、表达式split({DeptID|DeptNAme},'|')[1]split({DeptID|DeptNAme},'|')[2]手动生成新列。 在此处输入图像描述

  3. 数据预览如下: 在此处输入图像描述


@Kumar G 我们可以使用ADF 中的数据流来实现这一点。
例如,我创建了一个简单的测试。

  1. 我在 Azure Data Lake Gen2 中创建了一个 bolb,如下所示: 在此处输入图像描述

  2. 我创建了这个 blob 的数据源,选择Pipe (|)为 Column delimiter 和 First row as header. 在此处输入图像描述 架构如下: 在此处输入图像描述

  3. 我在ADF中创建了一个映射数据流,源数据预览如下: 在此处输入图像描述

  4. SurrogateKey1中,键入Row_NoKey Column,1作为 Start Value。 在此处输入图像描述 数据预览如下: 在此处输入图像描述

  5. Conditional split1中,用于Row_No < 3排除最后一行。 在此处输入图像描述

  6. Select1,未选择Row_No列, 在此处输入图像描述 数据预览如下: 在此处输入图像描述

就这样!


推荐阅读