arrays - 将 RDD[Array[Double]] 转换为 DataFrame[Array[Double]] 产生 DataFrame[WrappedArray]
问题描述
我有一个 RDD long, int, string, Array[Double]
,我需要将其转换为 DataFrame。转换myRDD.toDF()
工作正常,但我的问题是 Array[Double] 功能转换为 WrappedArray[Double]。生成的架构是:
root
|-- _1: long (nullable = false)
|-- _2: integer (nullable = false)
|-- _3: string (nullable = true)
|-- _4: array (nullable = true)
| |-- element: double (containsNull = false)
我遇到的问题是我无法对_4
列应用操作,就好像它是我可以在 RDD 上执行的值数组一样。这些WrappedArray
列似乎被视为以 开头的字符串WrappedArray(10.0, 33.4, 1.2, ...)
。在 RDD 上,我可以在这些元素上应用地图,但不能在 DataFrame 列上应用。将元素从 RDD 转换为 DataFrame 列的正确方法是什么,Array[Double]
以便将值视为一系列数字,而不是字符串"WrappedArray(....)"
解决方案
推荐阅读
- android - qmake install 忽略 android /res 文件夹
- c# - Masterdetailpage Xml 返回错误:InitializeComponent Not found
- powershell-6.0 - 如何在 PowerShell Core 6 中递归删除文件夹?
- django - 访问模板内的 ForeignKey 字段值
- php - 在 CakePHP TreeBehavior 中使用事务?
- jquery - Django + JQuery - 遍历表行,用 json 数据更新每一行
- python-3.x - 如何从 AWS S3 在 jupyter notebook 中导入 .py 文件
- paypal - 如何在 Paypal Sync 中获取购物车详细信息选项?
- android - findViewById 不能为空
- java - 将 GC 日志与 Logback 集成