java - 从 Hadoop 的 MultipleInputs 和 MultipleOutputs 生成单个文件
问题描述
当我使用 2 个文件MultipleInputs
和 2 个文件时,MultipleOutputs
我得到 2 个文件作为减速器输出。如何设置仅获取 1 个单个文件作为减速器输出?唯一的可能是使用SequenceFile
?
MultipleInputs.addInputPath(job, new Path(args[0]), TextInputFormat.class);
MultipleInputs.addInputPath(job, new Path(args[1]), TextInputFormat.class);
FileOutputFormat.setOutputPath(job, new Path(args[2]));
MultipleOutputs.addNamedOutput(job, "outMin", TextOutputFormat.class, Text.class, DoubleWritable.class);
MultipleOutputs.addNamedOutput(job, "outMax", TextOutputFormat.class, Text.class, DoubleWritable.class);
解决方案
推荐阅读
- c# - 仅将所需的存储过程添加到 EDMX
- android - Flutter 预缓存图像
- c++ - 我想更改变量值,但我想要的内存地址将保持不变,我该怎么做
- sql - Oracle 11g:插入记录时出现 ORA-00604 ORA-02429。无法插入表格
- .net - 部署警告 SQL46010:发布 SQL Server 项目时,.. 附近的语法不正确
- react-native - 使用在本机反应
- java - Java 数组不接受值
- android - 代码不起作用: void main() => runApp(MaterialApp(home: Center(child: Text('Hello World'))));
- php - 在我的 show.blade.php 文件中,当我遍历 $category->posts 时,我想排除视图显示的帖子
- javascript - 如果反应js中没有孙子项目,隐藏父项目标题的最佳方法