首页 > 解决方案 > 如何读取 JSON 文件中的嵌套 API 链接

问题描述

如果我的 JSON 文件是这样出来的,需要做的是转到 u_parent 中的 API 链接,并使用 sysparm_display_value=true 将该 API 链接中的值填充到 df 中。可能的?我需要这样做,因为这个 API 链接给了我相同的名字和父级,只有 u_parent 中的链接会给我正确的父级详细信息。

{
            "u_name": "******",
            "u_parent": {
                "display_value": "*****",
                "link": "https://*****.******.com/api/now/table/u_region_hierarchies/ed7f652f1b29341051380e93cc4bcbd7"
            },
            "sys_id": "159967df1b75601070bfdb9cbc4bcb35",
            "sys_updated_by": "mlarcheveque",
            "sys_created_on": "01/24/2021 17:31:26",
            "sys_mod_count": "1",
            "u_active": "true",
            "u_region_id": "**********",
            "sys_updated_on": "07/30/2021 14:13:33",
            "sys_tags": "",
            "sys_created_by": "admin"
        },

来自该 u_parent 的 API 链接显示以下值,我想要来自 u_parent 的显示值

{
    "result": {
        "u_name": "*****",
        "u_parent": {
            "display_value": "*****",
            "link": "https://*****.*****.com/api/now/table/u_region_hierarchies/6d7f252f1b29341051380e93cc4bcbd7"
        },
        "sys_id": "217f652f1b29341051380e93cc4bcbd4",
        "sys_updated_by": "mlarcheveque",
        "u_id": "*****",
        "sys_created_on": "07/30/2021 14:11:49",
        "sys_mod_count": "0",
        "sys_updated_on": "07/30/2021 14:11:49",
        "sys_tags": "",
        "sys_created_by": "mlarcheveque"
    }
}

所以我认为这将涉及一个 do while 循环,该循环遍历每一行并从嵌套的 API 链接获取值

标签: apache-sparkpyspark

解决方案


推荐阅读