apache-spark - Spark UI 的 SQL 选项卡中的指标“数据大小”(在 Exchange 步骤中)代表什么?
问题描述
下面的 55.7 TB 代表什么?
如果它是磁盘上 shuffle 输出文件的大小,那么在给定阶段 的 UI 的Jobs选项卡中显示为“Shuffle Write”的指标是什么:
对于“数据大小”,文档说“运营商的广播/洗牌/收集数据的大小(BroadcastExchange、ShuffleExchange、子查询)”,这不是很清楚......
是否类似于未压缩(默认为 lz4 算法)文件的大小?
谢谢 !
注意:一旦阶段完成,屏幕截图已被拍摄。
解决方案
推荐阅读
- reactjs - React.PropTypes.func.isRequired 的问题
- vb.net - 视觉工作室发生了什么?每次点击都会重复表单代码
- codeigniter - 当我选择服务器日期和时间时,它给了我错误的时间
- android-studio - 删除后如何更新ListView
- javascript - 用内部滚动反应原生 tabview 滚动标签栏
- android - Android 布局组元素
- django - 使用 Django 工作簿和工作表创建 Excel 文件
- javascript - 我可以在 HTML 页面中使用 ajax 函数调用发送参数吗?
- c - 使用 OpenSSL 发送数据
- css - 禁用聚合物中的所有 css 动画