azure-data-factory-2 - 如何在 Azure 数据工厂复制活动中使用源列对目标数据湖中的数据进行动态分区?
问题描述
我正在使用 ADF 复制活动,来源是 SQL 服务器。
现在我可能决定根据日期字段提取整个数据或增量数据 - 所以当我这样做时 - 我想根据此列在我的数据湖中创建/覆盖文件夹。
源数据:
col1
Col2
Col3 过滤列(日期)
目标湖:
例如,如果我提取 1 年的数据 - Lake 中的文件夹结构应创建如下(基于 FilterColumn):
实体/2020/03/01/abc.csv
实体/2020/03/02/abc.csv
实体/2020/03/03/abc.csv
实体/2020/03/04/abc.csv
..
..
实体/2021/02/28/abc.csv
其中文件夹是根据源过滤器列动态创建的 - 也作为选择查询的一部分出现。
关于如何在同一个复制活动中实现这一点的建议。
解决方案
推荐阅读
- python - 无法在中间模型中将 null 保存到 ForeignKey - Django
- dask - 使用 Dask 从多个 Python 进程编写 Parquet 文件
- c - 内核模块中已定义但未使用的变量消息
- r - 在 RStudio 中显示或呈现 html 的一般方法(就像在浏览器中一样)?
- html - 为什么 display: flex 会导致元素上下颠倒?
- pdf-generation - 快照测试 PDF
- wpf - 触发器覆盖绑定
- mysql - Laravel SQL 查询。帮我
- python - 如何在谷歌 colab 中显示 catboost 图?
- java - 在数组中使用多线程