apache-spark - Spark:和 RDD 一样,Datasets 和 Dataframes 也是不可变的?
问题描述
在 Apache Spark 中,RDD 是不可变的。
数据集和数据框怎么样?它们是可变的还是不可变的(因为底层结构仍然是 RDD)?
解决方案
数据集属于Spark-SQL API,在LogicalPlan和PhysicalPlan之后,转为RDD程序。所以数据集是不可变的。
推荐阅读
- python - 在特定列中查找唯一行
- angular - 在 Redux/ngrx 中转换存储属性的位置
- ios - 将图像放在圆形 CGRect 中
- shopify - Shopify:在登录表单上添加客户 [标签]
- php - 尝试使用 wp_signon() 记录用户
- mysql - 使用MySQL将时间划分为开始时间和结束时间时,如何在两个时间范围之间进行查询?
- java - 如果在运行 openssl passwd -apr1 命令时密码包含美元 ($) 字符,则无法获得所需的结果
- node.js - 如何构建节点 5.4.0 npm 3.3.12 - 早些时候它工作正常
- amazon-web-services - 如何让 ALB oidc 标头投入使用?
- python-3.x - 使用“spawn”启动方法了解 python 多处理子进程内存使用情况