首页 > 解决方案 > 使用 Nutch 抓取 Azure MFA 站点:如何使用 Nutch 抓取 Azure MFA 内部站点?

问题描述

我是 Crawling 和 Nutch 的新手。

我很少有内部站点具有 Azure AD MFA 身份验证,其中包含我需要对其进行爬网和索引以进行搜索的信息。

我已经在 Azure 中使用 Nutch 1.5 和 Solr 6.6 设置了一个 Ubuntu Server 18.04 VM,这对于正常的网站爬网工作正常。

问题是当我尝试使用 MFA 身份验证抓取网站时。

任何指导我如何克服这个问题:

1> 有什么我可以在 Nutch 中配置以使其开箱即用的东西吗?

2> 我需要在 Azure 中配置一些东西吗?

3> 任何其他建议或其他建议...

谢谢。

标签: azureauthenticationsolrazure-active-directorynutch

解决方案


推荐阅读