java - Hadoop - MapReduce 循环遍历同一组数据两次
问题描述
所以我只是在学习 Hadoop,我正在用 Java 编写,需要浏览一个包含 1000 个数字的文件并获得它们的平均值,然后再次浏览该文件并找出该平均数以下的数字。我创建了一个 MapReduce 来查找平均数,并将其输出到 hdfs 上的文件中。
我遇到的问题是将平均数字放入第二个 MapReduce,然后找出有多少数字低于平均值。我尝试使用 2 个作业和一个全局变量,但这似乎不起作用,我也尝试过读取文件,尽管它似乎只从本地驱动器读取文件。
我是新手,所以我可能会误解某些东西,但感谢您提供任何帮助。
解决方案
推荐阅读
- python - TypeError:列表索引必须是整数或切片,而不是使用python将json插入postgresql时的str
- java - 如何在 Java 中输入超过 4095 个字符的行?
- java - 这种建设的目的是什么?
- reactjs - 为团队使用设计框架
- javascript - 带有 glassfish 的 Java Websocket,在 Firefox 中出现错误 405
- c++ - C++ 比较彩票游戏中的数组值
- javascript - 单击“div”后,将添加 href 元素并加载该链接
- sql - [SQL]为重复行分配相同的 Day 标签
- android - 谁能提供一个将生成 ForegroundServiceStartNotAllowedException 的示例?
- javascript - Discord JS,不和谐按钮;如何在消息中附加超过 5 个按钮?