hadoop - 我们可以在单节点机器上并行运行多个拆分吗?
问题描述
我在单节点机器上使用 hadoop。当我运行一个大小为 1GB 且拆分大小为 128MB 的大文件时。因此,它以 8 个拆分运行文件,但这些拆分按顺序运行意味着一个拆分在完成另一个拆分后开始执行。我们是否必须设置任何属性值才能在单节点机器上并行运行拆分。
解决方案
Hadoop
提供了一个分布式处理框架(batch
),即MapReduce
并行执行任务。但是并行度取决于集群中的机器数量。也可以控制并行度,input split size
但由于您有独立设置,因此无法实现并行度。
推荐阅读
- javascript - ScrollView 属性“onScroll”只触发一次
- kubernetes - Kubernetes 自动缩放策略不起作用
- java - 如何从 Arraylist 中删除重复项
? (爪哇) - java - 尝试使用 Webviewer 加载网页 - JavaFx - 错误
- java - 如何在 Java 中执行 while 循环和 for 循环条件?
- windows - Windows任务计划程序最小化正在运行的程序并最大化另一个程序
- c# - 如何从字符串中获取数组
- r - 如何在ggplot2中做一个并排的条形图?
- android - Flutter 无法混淆和剥离符号
- node.js - 为什么 npm 使用干净的退出代码立即开始关闭我的前端容器?