首页 > 解决方案 > 使用 selenium 从页面中提取链接

问题描述

我是硒新手,我正在研究如何使用硒提取我想要的东西

我想提取网页中的超链接,但只提取具有特定标签的超链接。超链接都嵌套在以下结构中:

<a title="Chris Frye" class="_32mo" href="https://www.facebook.com/CnMFrye"><span>Chris Frye</span></a>

但是,当使用标签“a”时,我意识到它会抓取其他超链接,所以我相信我需要同时调整标签“a”和“类”。

在这种情况下,正确的策略是什么?我似乎无法使用driver.find_elements_by_tag_name,因为这仅适用于单个标签。

我要抓取的页面是:https ://www.facebook.com/public/chris-frie

标签: python-3.xseleniumweb-scrapingwebdriver

解决方案


您可以像下面这样使用 css 选择器:

elements = driver.find_elements_by_css_selector('a._32mo')

或者使用 xpath:

elements = driver.find_elements_by_xpath("//a[@class='_32mo']")

推荐阅读