首页 > 解决方案 > Hadoop - MapReduce 循环遍历同一组数据两次

问题描述

所以我只是在学习 Hadoop,我正在用 Java 编写,需要浏览一个包含 1000 个数字的文件并获得它们的平均值,然后再次浏览该文件并找出该平均数以下的数字。我创建了一个 MapReduce 来查找平均数,并将其输出到 hdfs 上的文件中。

我遇到的问题是将平均数字放入第二个 MapReduce,然后找出有多少数字低于平均值。我尝试使用 2 个作业和一个全局变量,但这似乎不起作用,我也尝试过读取文件,尽管它似乎只从本地驱动器读取文件。

我是新手,所以我可能会误解某些东西,但感谢您提供任何帮助。

标签: javahadoopmapreduce

解决方案


推荐阅读