首页 > 解决方案 > 如何将 WebSphere 门户配置为被 Scrapy 抓取并摄取到 elasticsearch

问题描述

我想使用 Scrapy 爬取 Websphere Portal8,并摄取到 elasticsearch。

我是否需要在 WP 中配置任何特殊的东西才能滚动/索引友好?例如,避免基于 javascript 的页面生成。

目前,抓取的页面很少,而不是预期的 50k 网址。

标签: elasticsearchscrapy

解决方案


推荐阅读