python - Selenium Python:如何在不针对特定类/id/tag 的情况下获取 css
问题描述
我正在做一个爬虫项目,其中一个目标是从网站的 HTML 和 CSS 中获取每个图像链接。我正在使用 BeautifulSoup 和 TinyCSS 来做到这一点,但现在我想在 Selenium 上切换所有内容,因为我可以加载 JS。
我无法在文档中找到一种无需知道标签/id/类即可定位某些 CSS 参数的方法。我可以轻松地从 HTML 中获取图像,但我需要针对 CSS 中的每个“背景图像”参数,以便从中获取 URL。
例如:背景图像:url(“paper.gif”);
有没有办法做到这一点,或者我应该循环进入每个元素并检查相应的 CSS(这会很耗时)?
解决方案
您可以获取所有样式标签并解析它们,搜索您的外观。
您也可以使用资源 URL 下载 css 文件并解析它们。
您还可以创建 XPATH/CSS 规则来搜索包含您要查找的参数的节点。
推荐阅读
- wordpress - 在哪里创建古腾堡块
- templates - Jinja2 For 循环 YAML 字典列表
- seaborn - Seaborn 热图轴格式反转图形
- go - 测试是否调用了函数
- c++ - 如何正确使用 Qt beginInsertRows
- java - 带有 Sqlite3 的 Spring Boot 无法自动装配 JPArepository 接口
- javascript - 如何将连续的字符串输入与javascript中的段落匹配,同时显示错误?
- jquery - Jquery - 从 div 文本动态地将值插入 h5
- static - 我可以避免在没有`static mut`的情况下重新编译我的平台层吗?
- javascript - React Native 如何监听生命周期中的上下文变化