首页 > 解决方案 > 如何在pyspark中使用nestes数组将数据框转换为dict

问题描述

我有这个数据框 sales_df:

id  year    month   total_sales
0   2020    1       200
1   2019    12      866474119
1   2019    10      555
1   2019    11      13073203
1   2020    2       5255259695
1   2020    1       13622027370

由此,我想制作一个字典,如下:

[
  {
    "2020": {
      "1": "200"
    },
    "id": "0"
  },
  {
    "2019": {
      "10": "555",
      "11": "13073203",
      "12": "866474119"
    },
    "2020": {
      "1": "13553473101",
      "2": "6000"
    },
    "id": "1"
  }
]

我将 df 转换为 pandas 获得我想知道的输出而不转换如何实现

标签: pythonpandasdataframepysparkpandas-groupby

解决方案


推荐阅读