python - Selenium 和 Python:使用动态 XPATH 查找元素
问题描述
我正在尝试从一个非常具体的 href 中提取 url,这个站点有很多非常非常的 html 路由!类似的,提取此 url 的唯一方法是通过我这样做的方式构建的 XPATH。
但最大的问题是,它一直在变化,标签的一部分是静态的,另一部分是动态的,有点随机
html 如下所示: 注意:page_name ="Laura"
是我可以选择的名称
# Option 1
<span label="answer by Laura to Charles">
# Option 2
<span label="answer by Laura to Nina">
# Option 3
<span label="answer by Laura to Maria">
<div >
<a href="www.thisisawebsite.otherthings.blabla...>
# Option n
<span label="answer by Laura to THIS COULD BE ANY RANDOM NAME">
<div >
<a href="www.thisisawebsite.otherthings.blabla...>
我尝试了不同的选择:
get_comment = WebDriverWait(self.driver, 2).until(
EC.presence_of_all_elements_located((
By.XPATH,
r'//span[contains(text(), "answer by {}")]/div/a'.format(page_name)))
)[0].get_attribute('href')
其他尝试:
get_comment = WebDriverWait(self.driver, 2).until(
EC.presence_of_all_elements_located((
By.XPATH,
r'//span[(@label="answer by {}")]/div/a'.format(page_name)))
)[0].get_attribute('href')
解决方案
如果您将其更改为,第二个应该可以工作
get_comment = WebDriverWait(self.driver, 2).until(
EC.presence_of_all_elements_located((
By.XPATH,
r'//span[contains(@label,"answer by {}")]/div/a'.format(page_name)))
)[0].get_attribute('href')
使用 '=' 时,它会搜索完全相同的字符串。这使您只能获得其中的一部分
推荐阅读
- mysql - 你如何从 docker 中连接到 mysql 服务器?
- api - 在 Vue 中挂载时,Axios 数据不会被转移到数据中
- nginx - 使用 nginx 服务两个 React 项目的问题
- github - 有没有办法在 Github 上隐藏分支?
- javascript - 单击连字符最小化按钮的奇怪问题
- pandas - SAS Do 循环到 Pandas 创建新变量
- spring-security - Spring 原生 - CustomAuthenticationManager (ReactiveAuthenticationManager)
- python - 我有一个 automod 设置,但是当我尝试在用户触发事件时提及用户时,我收到一个 ctx 错误,它说未定义作者
- android - 任务“:app:checkDebugAarMetadata”执行失败。当我尝试在 Android Studio 中运行我的程序时
- python - Pandas.Series.Str.Find 在列表中与 x 混合