使用 Puppeteer 在没有 href 链接的情况下获取标签内的文本,html,testing,web-scraping,puppeteer"/>

首页 > 解决方案 > 如何使用 Puppeteer 在没有 href 链接的情况下获取标签内的文本

问题描述

标签: htmltestingweb-scrapingpuppeteer

解决方案


有一种方法可以在名为xpath的网络抓取时找到非常有用的元素。从未与 puppeteer 合作过,但最近我与 selenium 合作了很多,并且我经常使用 xpath。

只是快速浏览一下 puppeteer 的文档,我发现了一些对你有用的东西。

https://github.com/GoogleChrome/puppeteer/blob/master/docs/api.md#pagexexpression

由于我没有完整的 html 页面,我能够制作一个简单的 xPath 来展示它的强大功能。

//div[@class='item']//a

您还可以在“元素”选项卡中打开 Google Chrome DevTools 并按 CTRL+F来测试 xpath

这是一个很好的网络抓取工具。


推荐阅读