首页 > 解决方案 > Puppeteer 返回阿拉伯字符而不是英文

问题描述

我正在使用 Puppeteer 库从网页中抓取一些数据,但它有时会返回奇怪的字符。我已经设置了浏览器和页面选项,如下所示。奇怪的部分并不总是发生。这可能是什么原因?

例如,我得到的是“چای خونه”而不是“茶室”。

//I set these options for the headless browser
 args: [
        "--no-sandbox",
        "--disable-notifications",
        "--disable-dev-shm-usage",
        "--lang=en-US,en-GB,en"
      ]

//I set also http 'Accept-Language' header like this way
await page.setExtraHTTPHeaders({
        'Accept-Language': 'en-US'
      });

// the function grabbing text from an html element
      grabElementText(element) {
        if (element) {
          return element._page.evaluate(el => el.innerText, element);
        }
      }

标签: puppeteer

解决方案


推荐阅读