hadoop - 映射器执行时间之间的巨大差异
解决方案
尝试使用该--split-limit
参数来优化您的导入。如果创建的拆分的大小大于此参数中指定的大小,则拆分将调整大小以适应此限制,拆分的数量将根据此更改。这会影响映射器的实际数量并导致更平衡的映射器。
推荐阅读
- r - 从R中的列表中删除包含任何字母字符的元素
- c++ - 霍夫曼编码单个字符而不使用查找表
- r - 如何在 R 中转换为“tableau”格式?
- javascript - 通过对记录进行分组来获取数组的映射
- python - 使用参数时,flask-restplus 产生“关键字参数‘严格’的多个值”
- php - 现在还使用 PHP 会话吗?
- dart - 如何等待路由完成?
- templates - 我什么时候应该在树枝中使用 {{attributes}} 而不是硬编码属性?
- javascript - 在 django 中使用引导日期选择器
- javascript - Collision Checking With JavaScript