python - 有什么方法可以在 Python 数据帧中创建根级列对象,如 Scala 中的结构类型?
问题描述
我需要将一些数据写入数据集,并且我需要将一列作为根,并在该列内再添加三列。我如何在 Python 中做到这一点?我有 Scala 的工作代码。
var myDf = myDf.withColumn(rootColumn, struct(myDf("column1"), myDf("column2"), myDf("column3")))
我已经尝试使用 pd.MultiIndex.from_product,我在顶部得到了 rootColumn,但这不适用于这种情况。我需要像上面的 Spark 代码一样的精确结果。架构有三列,一列是根,在该根列内我有多个列。我需要进行更改,以便可以根据该架构将数据框写入数据集。
解决方案
推荐阅读
- java - 为什么浏览器请求没有数据?java的ServerSocket和socket
- ag-grid - AG Grid 剪辑单元格中的长文本并在单击时全部显示
- javascript - 舍入一个数字,使其在 javascript 中不为 0
- java - 无法通过 lambda 在 AWS S3 存储桶中上传大于 1.3 的 pdf 合规性
- c++ - 在节点 C++ 插件中返回布尔值
- python - 为什么 roc_curve() 函数反转了 FPR 和 TPR 的值?
- javascript - 滑动滑块中的下一个和上一个按钮不工作
- android - 在应用程序启动时初始化安全提供程序 - 有必要吗?
- java - 检查字符串是否仅包含英文字符
- botframework - 在将本地机器人连接到本地 WebChat 客户端时获取 403(尽管适用于模拟器)