java - 如何在没有 Hadoop 的情况下运行 Apache Crunch 应用程序?
问题描述
我听说 Apache Crunch 是一个门面,它可以在没有 Hadoop 的情况下运行应用程序。这是真的?
如果是,那么该怎么做?
在Apache Crunch Getting Started中,第一个示例包括 hadoop 命令:
$ hadoop jar target/crunch-demo-1.0-SNAPSHOT-job.jar <in> <out>
可以省略hadoop
吗?
解决方案
也许您误解了您不需要 Hadoop集群。Hive、Pig、Spark 都可以在本地运行,也可以在 HDFS 以外的文件系统上运行。
根据我对库的了解,您确实需要 Hadoop API(这hadoop jar
将为您加载)。
换句话说,您可以将输入和输出目录设置为本地file://
路径来绕过需要 HDFS。
您可以export CLASSPATH
自己包含 Hadoop 库,并运行java jar
运行 JAR
推荐阅读
- python-3.x - pd.to_datetime 格式参数被拒绝
- c++ - 一个数字在所有查询中出现的次数?
- javascript - JS中的变量是对象吗
- c++ - 如何在 C++ 中使用矢量打印出特定员工的记录?
- c++ - 如何在普通数组的单元格中插入结构或指针?C++
- javascript - 如何通过在javascript中调用函数在对象内添加属性
- javascript - 如果选中其他单选按钮,请检查单选按钮
- html - 类型号不适用于小数位
- css - 在我的情况下,我必须为一行使用 5 col-md,另一个 col-md 需要在没有打开行的情况下进入下一行
- python - 如何将 dict keyx:valuex 列表转换为 dict key:keyx, value:valuex 列表?