首页 > 解决方案 > Spark:和 RDD 一样,Datasets 和 Dataframes 也是不可变的?

问题描述

在 Apache Spark 中,RDD 是不可变的。
数据集和数据框怎么样?它们是可变的还是不可变的(因为底层结构仍然是 RDD)?

标签: apache-sparkapache-spark-sqlrddapache-spark-dataset

解决方案


数据集属于Spark-SQL API,在LogicalPlan和PhysicalPlan之后,转为RDD程序。所以数据集是不可变的。


推荐阅读