mapreduce - Apache Crunch:如何设置多个输入路径?
问题描述
我有一个问题:我在使用 Apache Crunch 时无法设置多个输入路径。我怎么解决这个问题?
解决方案
您可以通过在列表中指定所有输入路径来将多个输入文件添加到 crunch。
public class Name {
public static void main(String[] args) {
Pipeline pipeline = new MRPipeline(Name.class, jobName, conf);
List<Path> inputPathList = new ArrayList<>(); // Add your InputPaths here
PCollection<String> source = From.sequenceFile(inputPathList, Text.class);
}
}
推荐阅读
- nginx - Nginx 删除 url 中的最后一部分
- c# - 如何使用 spring.net 将枚举作为属性传递给 c# 中的 app.config 文件
- java - 我很难让我的循环工作
- python - pandas csv 模块中的 writerow() 等价物是什么?
- java - Spring将csv转换为数组,而不是列表
- angular-material - 有条件地动态显示/隐藏角垫标签
- maven - 基于更新路径的条件作业和步骤
- javascript - 带有 async/await 的 setTimeout 未按预期运行
- google-cloud-platform - 如何使用计算引擎进行部署
- docker - Docker 容器即使只有一个私有网络也可以 ping 外部