apache-spark - Apache Spark 中宽变换后的分区数
问题描述
宽变换期间和之后的分区数是否保持等于 shuffle.partitions 参数,或者在宽变换完成后它们是否返回原始分区?在宽变换期间,必须为所有 shuffle 分区分配一个任务?
解决方案
是的,一旦完成宽变换,分区数就会恢复正常。通过设置 spark shuffle 分区并运行广泛的转换并检查 red.getNumPartitions 来验证相同。您可以通过简单的火花作业来尝试。
推荐阅读
- vue.js - 使用 vue js 更改 Leaflet js 地图颜色
- spring - @EnableOAuth2Sso 和 @EnableResourceServer 在同一个应用程序中
- reactjs - 反应 axios 一一获取值
- amazon-web-services - 如何将bucket-owner-full-control授予从一个帐户中的redshift卸载到另一个帐户中的s3存储桶的文件?
- android - AdMob 测试广告显示,真实的不显示(尝试了一切)
- vba - 尝试使用 FormulaArray 时出现错误 1004。替换技巧不起作用
- python - 正则表达式剪切字符串
- c# - 多维数组值
- android - 从 github 合并两个 android studio 项目
- vba - 循环访问另一个工作簿中的单元格以复制特定值