首页 > 解决方案 > 为什么 MapReduce 不能将输出放入内存中?

问题描述

我已经知道 MapReduce 在 shuffle 期间和 reducer 之后将数据输出到磁盘,这就是 mapreduce 比 Spark 慢的原因。我知道它在早期是这样设计的,因为计算机没有太多内存并且磁盘很便宜,但是现在为什么不改变这种设计,因为内存更大呢?为什么不更改源代码以将输出保存到 Spark 等内存中?

标签: hadoopmapreducebigdata

解决方案


推荐阅读