首页 > 解决方案 > Selenium 和 Python:使用动态 XPATH 查找元素

问题描述

我正在尝试从一个非常具体的 href 中提取 url,这个站点有很多非常非常的 html 路由!类似的,提取此 url 的唯一方法是通过我这样做的方式构建的 XPATH。

但最大的问题是,它一直在变化,标签的一部分是静态的,另一部分是动态的,有点随机

html 如下所示: 注意:page_name ="Laura"是我可以选择的名称

# Option 1
<span label="answer by Laura to Charles">
# Option 2
<span label="answer by Laura to Nina">
# Option 3
<span label="answer by Laura to Maria">
 <div >
  <a href="www.thisisawebsite.otherthings.blabla...>
# Option n
<span label="answer by Laura to THIS COULD BE ANY RANDOM NAME">
 <div >
  <a href="www.thisisawebsite.otherthings.blabla...>

我尝试了不同的选择:

get_comment = WebDriverWait(self.driver, 2).until(
                        EC.presence_of_all_elements_located((
                            By.XPATH,
                            r'//span[contains(text(), "answer by {}")]/div/a'.format(page_name)))
                    )[0].get_attribute('href')

其他尝试:

get_comment = WebDriverWait(self.driver, 2).until(
                            EC.presence_of_all_elements_located((
                                By.XPATH,
                                r'//span[(@label="answer by {}")]/div/a'.format(page_name)))
                        )[0].get_attribute('href')

标签: pythonhtmlpython-3.xseleniumselenium-webdriver

解决方案


如果您将其更改为,第二个应该可以工作

get_comment = WebDriverWait(self.driver, 2).until(
                            EC.presence_of_all_elements_located((
                                By.XPATH,
                                r'//span[contains(@label,"answer by {}")]/div/a'.format(page_name)))
                        )[0].get_attribute('href')

使用 '=' 时,它会搜索完全相同的字符串。这使您只能获得其中的一部分


推荐阅读