首页 > 解决方案 > Azure 数据工厂 V2 - 解析 JSON HTTP GET 数据集

问题描述

我正在尝试使用 Azure 数据工厂 V2 中的 HTTP GET 连接器来使用下面的 API 响应。我无法正确解析数据集,并且由于数据不是正确的 JSON 对象或数组格式,反序列化期间活动失败的错误消息不断出现。

我试图利用 JSONPath 来隔离特定的键值对,但我一直收到同样的错误。我已经使用许多其他 API 成功地做到了这一点,但似乎无法弄清楚这一点。最终,我只想创建一个包含日期列的表,另一个用于收入,另一个用于收入成本,依此类推。

关于使用 Azure 数据工厂 V2 解析此 API 响应的最佳方式的任何想法?提前致谢。

 {
     "AAPL": {
         "Revenue": {
             "2013-09": "170910",
             "2014-09": "182795",
             "2015-09": "233715",
             "2016-09": "215639",
             "2017-09": "229234",
             "TTM": "239176"
         },
         "Cost of revenue": {
            "2013-09": "106606",
            "2014-09": "112258",
            "2015-09": "140089",
            "2016-09": "131376",
            "2017-09": "141048",
            "TTM": "147254"
         }
     } 
}

标签: jsonazureazure-data-factory

解决方案


我认为您的问题更多的是数据结构性质。导入时使用的JSON 格式可以与jsonPathDefinition参数一起使用以将路径映射为列,问题是,格式化程序无法在收入下的项目和收入成本下的项目之间执行关联(意味着从两个位置获取项目索引 0并为它们创建一行)。

我认为您需要在导入之前对JSON文件进行一些自定义预处理。

希望能帮助到你!


推荐阅读