首页 > 解决方案 > Nutch/Hadoop:如何配置 url 来跟踪作业?

问题描述

我是 Nutch 和 Hadoop 的新手。我按照几个教程为 windows/eclipse 设置 nutch 和 hadoop。我在获取过程中遇到了一些错误,希望查看有关作业的更多信息,但跟踪作业的 url 指向http://localhost:8080/,我无法访问它。当我运行 Hadoop 时,它在http://localhost:8088上运行,我试图将跟踪 url 指向该地址。

我试图添加

   <property>
     <name>yarn.resourcemanager.webapp.address</name>  
     <value>127.0.0.1:8088</value>
   </property>
   <property>
     <name>yarn.resourcemanager.address</name>  
     <value>127.0.0.1:8088</value>
   </property>

到 yarn-site.xml 但它不起作用。有人可以为我指出正确的方向,即如何配置“跟踪工作的 URL”或从哪里获取这些信息?

标签: eclipsehadoopnutch

解决方案


当前运行的 Yarn 应用程序显示在http://localhost:8088/cluster/apps/RUNNING - 应该有一个链接到您要跟踪的实际 Nutch 作业。

端口 8088 是默认端口(请参阅yarn-default.xml),因此无需重新配置它。


推荐阅读