azure-data-factory - 如何使用 ADF 检查同一源中的重复项
问题描述
我有一个包含许多重复行的单一源 CSV。我想突出显示或删除这些重复项。有谁知道怎么做?
解决方案
数据流可以做到这一点!
伟大的克罗默在这里很好地解释了这一点:https ://kromerbigdata.com/2019/04/21/use-adf-mapping-data-flows-for-fuzzy-matching-and-dedupe/
希望这有帮助!
推荐阅读
- sql - 列名或提供的值的数量与表定义不匹配。微软SQL
- php - 如何限制查询laravel中的数据数量
- angular - 如何以角度形式检索多选的值?
- python - 更新某些 CKAN 数据集元数据
- django - Django Rest 序列化程序外键是必需的错误
- javascript - 如何在 NativeScript 中从 Java 获取定义的实例/变量?
- react-testing-library - 使用 react-testing-library 在 `describe` 中渲染的组件在 `it` 中不可见
- java - 使用 H2 db 模拟 Jdbctemplate 会出错
- php - phpunit 没有在 laravel 中运行
- php - Yii 1 Pagination 在不同的控制器中显示不同的行为