首页 > 解决方案 > 有什么方法可以在 Python 数据帧中创建根级列对象,如 Scala 中的结构类型?

问题描述

我需要将一些数据写入数据集,并且我需要将一列作为根,并在该列内再添加三列。我如何在 Python 中做到这一点?我有 Scala 的工作代码。

var myDf  = myDf.withColumn(rootColumn, struct(myDf("column1"), myDf("column2"), myDf("column3")))

我已经尝试使用 pd.MultiIndex.from_product,我在顶部得到了 rootColumn,但这不适用于这种情况。我需要像上面的 Spark 代码一样的精确结果。架构有三列,一列是根,在该根列内我有多个列。我需要进行更改,以便可以根据该架构将数据框写入数据集。

标签: pythonscaladataframe

解决方案


推荐阅读