json - 根据行数而不是数据大小 azure 数据工厂拆分 JSON 文件
问题描述
我的问题是,我正在尝试使用 Azure 数据工厂 (ADF) 将数据推送到 Web 服务以写入目标系统。但是,ADF 对 1 分钟的 Web 服务步骤有限制。我需要解决这个问题,我正在尝试将 json 文件拆分为多个文件。
过程:
- 收到带有 CSV 文件的电子邮件
- CSV 文件被放入 Blob 存储
- CSV 文件转换为 JSON
- 使用 API 写入目标系统
1 分钟后第 4 步超时。所以我希望解决这个问题,我的第一个倾向是将 json 数据块拆分,并通过 ADF 中的循环将每个数据块传递给 API。
我面临的挑战是如何根据条目而不是大小来分解 json 文件。
我曾尝试在 ADF 中使用元数据来获取计数,但我没有成功。
解决方案
获取元数据活动无法从 JSON 获取 columnCount
从二进制、JSON 或 XML 文件获取元数据时,不支持 structure 和 columnCount。
你可以创建一个 Azure 函数并将 JSON 数据传递给它。然后,您可以在 Azure Function 中将 JSON 数据拆分为多个块。最后通过 For Each 或 Until 活动循环这些块并在其中执行 step4。
推荐阅读
- azure-data-factory - 数据工厂:如何递归更新 blob 文件结构中的每个 JSON 文件
- reactjs - 为什么 React 状态返回未定义但页面仍然从状态 OK 加载?
- java - 除了 Jasypt 之外,还有其他方法可以在应用程序属性中使用加密密码吗?
- c# - Selenium:取消选中并检查模态内的不同值
- ios - 当前位置未显示在 iOS 模拟器中,使用注释指向 MKMapView 中的特定位置
- powerbi - 无需渲染即可下载 power bi 报告
- javascript - Angular rxjs主题:在发出值后订阅主题
- apache - 使用 .htaccess 将多个域动态指向单个域的子文件夹
- tensorflow - 自动安装 Cuda 11.4 而不是 cuda 11.2
- python - 在用户定义的数量下方的列表中输出值 - 函数