html - 如何使用 Puppeteer 在没有 href 链接的情况下获取标签内的文本
问题描述
解决方案
有一种方法可以在名为xpath的网络抓取时找到非常有用的元素。从未与 puppeteer 合作过,但最近我与 selenium 合作了很多,并且我经常使用 xpath。
只是快速浏览一下 puppeteer 的文档,我发现了一些对你有用的东西。
https://github.com/GoogleChrome/puppeteer/blob/master/docs/api.md#pagexexpression
由于我没有完整的 html 页面,我能够制作一个简单的 xPath 来展示它的强大功能。
//div[@class='item']//a
您还可以在“元素”选项卡中打开 Google Chrome DevTools 并按 CTRL+F来测试 xpath
这是一个很好的网络抓取工具。
推荐阅读
- javascript - 在 setState 中使用变量 - 反应
- javascript - VueJS 道具 - 我怎样才能避免“类”属性继承?
- vba - 在单元格范围内复制粘贴值
- c++ - 在异步 TCP 服务器的上下文中从 N 头访问数据时的线程安全
- java - 迭代 List<> 中包含的 HashMap<> 以将 map 中包含的数组变量添加为 java 中的值
- java - 如何输入字符串数据?
- javascript - 币安 API Hmac 签名
- apache-kafka - 在日志压缩的情况下,Kafka 回复如何工作?
- java - 如何将此 switch 语句交换为多态方法?
- java - 通过单击另一个 JFrame 窗口中的按钮打开一个新的 JFrame 窗口