首页 > 解决方案 > azure 数据湖 - 验证 csv 中的要求字段

问题描述

我开始使用大数据。假设我将收到多个 csv 文件,这些文件将存储在 Azure Data Lake 中并且它们具有已定义的架构,那么最好的方法是:

-验证是否将在 CSV 中提供必填字段(并非所有字段都是必需的)

-获取成功匹配定义模式的记录

- 获取与定义的模式不匹配的记录

我已经查看了 USQL 以及它可以多快合并/提取/分组数据,但它并不被认为是逐行验证的正确工具。我还查看了 Azure 数据工厂,但我不确定是否是正确的工具或如何完成此操作。

提前致谢

标签: azureazure-data-factoryazure-data-lakeu-sqlazure-data-lake-gen2

解决方案


推荐阅读