首页 > 解决方案 > 将 JSON(ADF 活动的输出)转换为 Dataframe 以用于下一个活动

问题描述

在此处输入图像描述

在 Azure 数据工厂中,我有 2 个 Databricks 笔记本。sample1 的结果是一个熊猫数据框。我使用以下代码转换为 JSON 并将其发送到输出。

processing_result = normalized_features.to_json(orient="index")
dbutils.notebook.exit(processing_result)

输出是:

 "runOutput": {
        "0": {
            "mean": 1.124771,
            "max": 6.0006,
            "min": 0.054,
            "std": 0.9000992859,
            "median": 0.8932,
            "L1": 112.4771,
            "MAD": 0.64386804,
            "percent_above_mean": 0.38,
            "variation_from_mean": 0.64386804
        }
    },

在此处输入图像描述

在 databricks sample2 中,我想使用 sample1 的输出,我需要将 JSON 转换为数据帧。我该怎么做?

意思是 最大限度 分钟 性病 中位数 L1 疯狂的 percent_above_mean 变异自均值
1.12 6.00 0.05 0.9 0.89 112 0.64 0.38 0.643

标签: pythonpandasazure-data-factory

解决方案


我用下面的代码解决了这个问题json_normalize

message_input = dbutils.widgets.get("input")
message_json = json.loads(message_input)
normalized_features = json_normalize(message_json['0']) 

推荐阅读