html - 阴影根的 css 选择器(关闭),python 3
问题描述
我想使用scrapy spider的css选择器从以下html中提取下一页url。
<button id="omni-next-click" name="searchnextclick" class="btn btn__blue btn__rounded" aria-label="next" data-reactid="971" omnivalue="1">
<span class="icon icon__arrow-right" data-reactid="972">
<svg aria-hidden="true" data-reactid="973">
<use xlink:href="/images/adaptive/livestyleguide/walgreens.com/v3.0/themes/images/icons/symbol-defs.svg#icon__arrow-right" data-reactid="974">
#shadow-root (closed)
<svg id="icon__arrow-right" viewBox="0 0 32 32">
<title>icon__arrow-right</title>
<path d="M13.312 21.952c-0.144 0-0.288-0.064-0.4-0.176-0.224-0.224-0.224-0.592 0-0.816l4.976-4.976-4.976-4.96c-0.224-0.224-0.224-0.592 0-0.816s0.592-0.224 0.816 0l5.376 5.376c0.224 0.224 0.224 0.592 0 0.816l-5.376 5.376c-0.128 0.112-0.272 0.176-0.416 0.176z">
</path>
</svg>
</use>
</svg>
</span>
</button>
我是新手。请帮助我完成它。如何找到 css 以便可以爬取所有可用页面?
解决方案
推荐阅读
- python - 高斯过程的对数边际似然的sklearn计算是正的?
- windows - 需要确定以太网适配器的网络访问类型
- aws-lambda - 停止所有不包含 AWS 中具有特定值的标签的 ec2 实例
- ms-access - 使用日期的条件表达式中的数据类型不匹配
- php - 将代码推送到 GitHub 存储库后如何查找错误?
- sql-server - 如果一列为 Null,则选择其他列
- java - 使用 mySQL 数据库在 JSP 中实现移动平均函数
- php - 如何使用日期从数据库中获取数据?
- mongodb - 如何获取 mongodb 集合中的所有重复文档?
- python - django rest框架中对pandas DataFrame的重复操作