scala - Spark中的Kryo vs Encoder vs Java序列化?
问题描述
哪种序列化用于哪种情况,
从 spark 文档中它说:
它提供了两个序列化库:
1. Java(默认)和
2. Kryo
现在编码器从哪里来,为什么文档中没有给出。
并且从 databricks 中它说编码器对数据集的执行速度更快,RDD 怎么样,以及所有这些映射如何结合在一起。在哪种情况下我们应该使用哪个序列化程序?
解决方案
Encoders
仅用于Dataset
。Kryo
在 spark 内部使用。Kryo
并且Java
序列化可供您用于数据混洗。
至于你应该使用哪个 -Kryo
如果你不使用Dataset
. 否则,实际上你没有任何选择。
推荐阅读
- flutter - 如何解决 Flutter 上未使用 import 的问题?
- jquery - 在 mouseleave 上隐藏元素(仅在快速移动时?)
- java - 当子字符串包含某些字符时更改整个字符串
- local-storage - 第一次在 SwiftUI 中未保存和更新 UserDefaults
- python - Youtube API v 3 中的布尔 OR(Python 代码)
- r - 如何确定层次聚类中的聚类数量
- python - 用下一个递增数字填充空值 | PySpark | Python
- javascript - GWT:将处理程序添加到本机 js 事件 onafterprint
- java - 唯一标识JAVA中终止的线程
- c# - unity register 泛型类型