eclipse - Nutch/Hadoop:如何配置 url 来跟踪作业?
问题描述
我是 Nutch 和 Hadoop 的新手。我按照几个教程为 windows/eclipse 设置 nutch 和 hadoop。我在获取过程中遇到了一些错误,希望查看有关作业的更多信息,但跟踪作业的 url 指向http://localhost:8080/,我无法访问它。当我运行 Hadoop 时,它在http://localhost:8088上运行,我试图将跟踪 url 指向该地址。
我试图添加
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>127.0.0.1:8088</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>127.0.0.1:8088</value>
</property>
到 yarn-site.xml 但它不起作用。有人可以为我指出正确的方向,即如何配置“跟踪工作的 URL”或从哪里获取这些信息?
解决方案
当前运行的 Yarn 应用程序显示在http://localhost:8088/cluster/apps/RUNNING - 应该有一个链接到您要跟踪的实际 Nutch 作业。
端口 8088 是默认端口(请参阅yarn-default.xml),因此无需重新配置它。
推荐阅读
- javascript - Vue:如何在数据更改时更新使用数据的元素?
- r - 比较字符串提取差异到新列 R
- angular - ngFor 在数组更改时不重新渲染组件
- javascript - 自定义图像复选框
- r - 当使用 Rscript 作为 cron 作业调用时,R 包(例如 lubridate)不起作用
- facebook-graph-api - Facebook Graph Api,页面的访问者帖子缺少来自字段
- java - 从 JSP 页面发送对象
- java - java字符串可以转换为方法调用吗?
- python - 这个 [0] 可以表示整个列表吗?
- microsoft-graph-api - 将 Office Dialog API 与 Angular 2 一起使用(用于 Outlook 插件)