python-3.x - 使用 selenium 从页面中提取链接
问题描述
我是硒新手,我正在研究如何使用硒提取我想要的东西
我想提取网页中的超链接,但只提取具有特定标签的超链接。超链接都嵌套在以下结构中:
<a title="Chris Frye" class="_32mo" href="https://www.facebook.com/CnMFrye"><span>Chris Frye</span></a>
但是,当使用标签“a”时,我意识到它会抓取其他超链接,所以我相信我需要同时调整标签“a”和“类”。
在这种情况下,正确的策略是什么?我似乎无法使用driver.find_elements_by_tag_name
,因为这仅适用于单个标签。
解决方案
您可以像下面这样使用 css 选择器:
elements = driver.find_elements_by_css_selector('a._32mo')
或者使用 xpath:
elements = driver.find_elements_by_xpath("//a[@class='_32mo']")
推荐阅读
- c# - 如何在 ASP.NET Core 的 DI 注入器中注册映射到相同类型的两个配置
- r - 为什么在模型训练期间选择的超参数与来自重采样的超参数不同?
- swift - 如何在 Swift 中删除 uicollectionviewcell 核心数据项
- json - 如何在 cURL GET 命令中使用 URL 变量
- amazon-web-services - 如何使用 AWS ECS 从 Parameter Store 获取数据库密钥
- api - 关于 API GET 调用中的身份验证问题
- excel - VLOOKUP 搜索多列
- java - 我们何时必须使用@ModelAttribute,以及它是如何工作的
- sql - SQL:如果与相应列模糊匹配,则选择行
- mips - MIPS 是否在堆栈指针之前或之上存储 sw 和 lw 的偏移量?