首页 > 解决方案 > 无法抓取网站运行代码时出错。TimeoutError: Navigation Timeout Exceeded: 超过 30000ms

问题描述

我想抓取一个本地网站('https://nieis.namibiaatwork.gov.na/')它只是不断超时'运行代码时出错。TimeoutError: Navigation Timeout Exceeded: 30000ms exceeded' 所有其他网站都被毫无问题地抓取。

我尝试使用以下方法忽略不良证书:

      headless: true,
      ignoreHTTPSErrors: true,
      args: [
        "--proxy-server='direct://'",
        '--proxy-bypass-list=*',
        '--disable-gpu',
        '--disable-dev-shm-usage',
        '--disable-setuid-sandbox',
        '--no-first-run',
        '--no-sandbox',
        '--no-zygote',
        '--single-process',
        '--ignore-certificate-errors',
        '--ignore-certificate-errors-spki-list',
        '--enable-features=NetworkService'
      ]
    }); 

但我得到的只是'运行代码时出错。SyntaxError:意外的令牌:'。

我还尝试强制网站等到整个页面加载完毕:

await page.goto('https://nieis.namibiaatwork.gov.na', {waitUntil: 'load', timeout: 0});

但我得到的只是'TypeError:无法获取'。

在我的实时服务器上实现代码之前,我正在使用https://try-puppeteer.appspot.com/来测试网站抓取。

是否有一些无法抓取的网站,或者是否有其他图书馆可以用来抓取上述网站,任何可以帮助我抓取该网站的信息将不胜感激。

标签: puppeteer

解决方案


推荐阅读