首页 > 解决方案 > 使用 selenium 从网站获取跨度文本

问题描述

我试图抓取的网站如下所示:

<div align="center" class="movietable">
    <span style="width:45px;height:47px;vertical-align:middle;display:table-cell;">
        <a href="browse.php?cat=19"><img border="0" src="styles/images/cat/hd.png" alt="HdO"></a>
    </span>
</div>
<div align="left" class="movietable">
    <span style="padding:0px 5px;width:455px;height:47px;vertical-align:middle;display:table-cell;">
        <a data-toggle="tooltip" data-placement="bottom" data-html="true" title="" href="details.php?id=578197" data-original-title="<img src='https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg'>">
            <b>GET THIS TEXT</b></a><br><font class="small">[Action, Horror, Sci-Fi]</font>
        </span>
    </div>

我怎样才能提取:

  1. <b>标签中的文本- 在这种情况下GET THIS TEXT
  2. font_class= 'small' 的内容 - 在这种情况下,这将是Action, Horror, Sci-Fi
    .movi​​etable b 效果很好!!

  3. img_scr 链接 - 在这种情况下,它将是https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg

我不知道该怎么做

标签: pythonseleniumweb-scrapingautomation

解决方案


以下是您可以使用的 CSS 选择器:

  1. driver.find_element_by_css_selector('div[align=left] b')
  2. driver.find_element_by_css_selector('div[align=left] .small')
  3. driver.find_element_by_css_selector('a[title]').get_attribute('data-original-title')

推荐阅读