puppeteer - 无法抓取网站运行代码时出错。TimeoutError: Navigation Timeout Exceeded: 超过 30000ms
问题描述
我想抓取一个本地网站('https://nieis.namibiaatwork.gov.na/')它只是不断超时'运行代码时出错。TimeoutError: Navigation Timeout Exceeded: 30000ms exceeded' 所有其他网站都被毫无问题地抓取。
我尝试使用以下方法忽略不良证书:
headless: true,
ignoreHTTPSErrors: true,
args: [
"--proxy-server='direct://'",
'--proxy-bypass-list=*',
'--disable-gpu',
'--disable-dev-shm-usage',
'--disable-setuid-sandbox',
'--no-first-run',
'--no-sandbox',
'--no-zygote',
'--single-process',
'--ignore-certificate-errors',
'--ignore-certificate-errors-spki-list',
'--enable-features=NetworkService'
]
});
但我得到的只是'运行代码时出错。SyntaxError:意外的令牌:'。
我还尝试强制网站等到整个页面加载完毕:
await page.goto('https://nieis.namibiaatwork.gov.na', {waitUntil: 'load', timeout: 0});
但我得到的只是'TypeError:无法获取'。
在我的实时服务器上实现代码之前,我正在使用https://try-puppeteer.appspot.com/来测试网站抓取。
是否有一些无法抓取的网站,或者是否有其他图书馆可以用来抓取上述网站,任何可以帮助我抓取该网站的信息将不胜感激。
解决方案
推荐阅读
- neo4j - 所有孩子的 Neo4j 循环
- react-native-navigation - 如何使用本机反应在菜单页面中获取导航参数
- tcp - 了解 Wireshark 中捕获的 TCP 会话
- .net - 如何通过 .net 代码读取扩展事件
- windows - 任务调度程序 - 任务注册被删除
- delphi - SysUtils.LoadPackage 替换 Aplication.OnMessage 处理程序
- c# - System.Diagnostics.Process.Start 用于 SQL 中的 .pdf 文件路径
- matlab - 将 IEC 61131-3 DINT 拆分为两个 INT 变量(PLC 结构化文本)
- php - Microsoft Graph API - 为作业获取评分“maxPoints”
- spring-boot - @RefreshScope 和 @Order