hadoop - Google 云上 dataproc gui 版本中的 Hadoop 作业错误
问题描述
我正在尝试使用org.apache.hadoop.examples.WordCount为 wordcount 创建一个作业,但它显示错误:
我正在附上我的工作配置的图像以及我的存储桶中的文件在哪里(我使用的是存储桶而不是 hdfs)
使用的作业配置:
解决方案
问题是默认情况下 Hadoop 不会写入现有路径,除非特别要求“覆盖”模式。你有两个选择:
- 在运行示例之前删除输出路径
- 每次运行使用另一个输出路径
通常,作业的输出可以在 Google Cloud 控制台中找到 - 在 Dataproc 下查找“作业”页面,或在集群页面下查找作业选项卡。此外,如此处所示,输出保存到 GCS,您可以随时从那里检索它。
推荐阅读
- r - 为 R 中的每个变量绘制单独的箱线图
- flutter - 如何解决方法'[]'在空颤动上被调用
- python - python在列表中查找重复的对象
- javascript - 打字时如何格式化电话号码?
- flutter - 如何将类类型分配给飞镖上的变量
- graphql - KeystoneJS 在从 AdminUI 上传图像时抛出 INTERNAL_SERVER_ERROR 'Missing multipart field 'operations'
- jupyter-notebook - jupyter lab 中未显示简单的交互式 matplotlib 图
- r - 使用 ROxygen 的 R6 文档
- powershell - 无法使用 foreach-object 并行启动作业
- mysql - 对表格进行排序,但将多组行放在一起