首页 > 解决方案 > 如何理解 hadoop mapred.min.split.size 和 minSplitSize?

问题描述

在hadoop mapreduce中,设置map阶段的map数量时,需要设置mapred.min.split.size,但是看官方文档的时候,还有一个参数就是“minSplitSize”。两者有什么区别?

标签: hadoopmapreduce

解决方案


首先,根据hadoop docs ,“mapred.min.split.size”被弃用,取而代之的是“mapreduce.input.fileinputformat.split.minsize” 。

尽管如此,“mapred.min.split.size”用于在 xml 配置文件中配置您的 hadoop 集群,而“minSplitSize”用于FileInputFormat类的 setMinSplitSize 方法中,以编程方式直接在您的作业配置中设置值并特定于单个工作。

祝你好运


推荐阅读