首页 > 解决方案 > Puppeteer 单击 span 元素中的链接

问题描述

我正在尝试解析一个漫画网站并保存所有页面。我有代码可以在保存图像的页面中运行。

我无法单击转到下一页的链接。我正在使用 Node 并使用 Puppeteer。我以为我可以document.querySelectorAll("span.next-prev-text")用来获取链接中的跨度。

包括用于尝试获取下一页的相关代码和 html 我正在尝试单击 NEXT CHAPTER 链接。

<div class="col-md-6 prev-post">
  <a class="" href="https://tokyorevengersmanga.com/manga/tokyo-manji-revengers-vol-1-chapter-1-reborn/">
     <span class="next-prev-text">PREVIOUS CHAPTER </span>
  </a>
</div>

<div class="col-md-6 next-post">
  <a class="" href="https://tokyorevengersmanga.com/manga/tokyo-manji-revengers-chapter-3/">
       <span class="next-prev-text">NEXT CHAPTER</span>
  </a>
</div>
(async() => {
    try {
      const browser = await puppeteer.launch();
      const page = await browser.newPage();

      //starting page
      await page.goto(
        "https://tokyorevengersmanga.com/manga/tokyo-manji-revengers-vol-1-chapter-1-reborn/"
      );

      console.log("page has loaded")

      const chapter = await page.evaluate(() => {
        const pages = Array.from(
          document.querySelectorAll("img.aligncenter")
        ).map((image) => image.getAttribute("src"));
        return pages
      });

      fs.writeFileSync("./data.json", JSON.stringify(chapter));
      console.log("File is created!");

      const nextPage = await page.evaluate(() => {
        var obj = document.querySelectorAll("span.next-prev-text");
        return obj[1];
      })

      await page.click(nextPage);
      await page.waitForNavigation();
      await browser.close();
    } catch (error) {
      console.log(error);
    }

标签: javascripthtmlnode.jspuppeteer

解决方案


page.click()唯一需要一个字符串选择器。我不知道为什么,但调用page.click(".next-prev-text")会抛出一个错误,说Error: Node is either not visible or not an HTMLElement.

解决方法是使用page.$$()实​​际调用document.querySelectorAll(). 它返回一个数组,因此您可以简单地ElementHandle调用click().ElementHandle

当您单击“下一章”链接时,我还添加了处理弹出页面的代码。

这是要测试的完整代码。

const puppeteer = require('puppeteer');
const fs = require('fs');

(async () => {
  try {
    const browser = await puppeteer.launch({
      headless: false
    });
    const page = await browser.newPage();

    //starting page
    await page.goto(
      "https://tokyorevengersmanga.com/manga/tokyo-manji-revengers-vol-1-chapter-1-reborn/"
    );

    console.log("page has loaded")

    const chapter = await page.evaluate(() => {
      const pages = Array.from(
        document.querySelectorAll("img.aligncenter")
      ).map((image) => image.getAttribute("src"));
      return pages
    });

    fs.writeFileSync("./data.json", JSON.stringify(chapter));
    console.log("File is created!");

    const next = await page.$$(".next-prev-text");
    const [popup] = await Promise.all([
      new Promise((resolve) => page.once('popup', async p => {
        await p.waitForNavigation({
          waitUntil: 'networkidle0'
        });
        resolve(p);
      })),
      next[1].click()
    ]);

    // do your job on the next page with 'popup' here

    await browser.close();
  } catch (error) {
    console.log(error);
  }
})();


推荐阅读