首页 > 解决方案 > Typo3 9.5:使用前端登录抓取页面

问题描述

我在一个基于 Typo3 v9.5.23 的 Intranet 上进行了工作。他们使用 indexed_search v9.5.23 和 crawler v9.1.5 来爬取页面,但在我为每个页面获取tx_crawler_queue的列中的数据库表中。result_data{"content":"\"403 Access denied\""}

要查看您必须以前端用户身份登录的页面。我必须做什么才能抓取这些页面?

我正在使用带有以下命令的控制台:

vendor/bin/typo3 crawler:flushQueue all
vendor/bin/typo3 crawler:buildQueue 69 intranet --depth=2
vendor/bin/typo3 crawler:processQueue

标签: typo3-9.xtx-indexed-search

解决方案


爬虫配置中,您会找到一个字段Crawl with FE user groups

由于任何 FE 登录都需要 FE 用户组,您应该选择可能的组进行爬网。


推荐阅读