首页 > 解决方案 > 将 libsvm 格式的 pysaprk 数据帧保存到 s3

问题描述

我有一个包含两列的 pyspark 数据框 -featureslabel.

features是我经过多次变换后创建的稀疏向量,最后使用 vectorassembler. 我想以 libsvm 格式将此数据帧写入 s3,但我正在努力获得有关如何做到这一点的任何线索。

编辑 1:寻找解决方案而不将数据框转换为 RDD

标签: pythonapache-sparkmachine-learningpyspark

解决方案


推荐阅读