azure - 使用 Nutch 抓取 Azure MFA 站点:如何使用 Nutch 抓取 Azure MFA 内部站点?
问题描述
我是 Crawling 和 Nutch 的新手。
我很少有内部站点具有 Azure AD MFA 身份验证,其中包含我需要对其进行爬网和索引以进行搜索的信息。
我已经在 Azure 中使用 Nutch 1.5 和 Solr 6.6 设置了一个 Ubuntu Server 18.04 VM,这对于正常的网站爬网工作正常。
问题是当我尝试使用 MFA 身份验证抓取网站时。
任何指导我如何克服这个问题:
1> 有什么我可以在 Nutch 中配置以使其开箱即用的东西吗?
2> 我需要在 Azure 中配置一些东西吗?
3> 任何其他建议或其他建议...
谢谢。
解决方案
推荐阅读
- linux - Windows sublinux - 获取调用 linux 的 Windows 路径
- java - 从串口读取会拆分字符串
- javascript - 如何修复 .js 文件 url 重定向到双 WWW?
- kubernetes - 终止 kubernetes 作业 / cronjob 的 istio sidecar istio-proxy
- python - SQLAlchemy LookupError:“DIVERSE”不在定义的枚举值中
- java - 通过输入 HashMap 值获取 HashMap 键未按预期工作
- wildfly - 获取所有具有绑定值的限定符的bean
- oracle - 我可以同时触发“之前”和“之后”事件吗?
- python - python redis rpush for循环失败
- r - 循环特定年份的月度指数