html - 如何使用 Selenium 从网站获取不断变化的价值
问题描述
我想读一个网站的价值,我想读的价值是“DKK 5.000,00”这里是网站的样本大小
<span class="text"> Saldo : </span>
<span class="text value"> DKK 5.000,00 </span>
<span class ="text" > < / span >
这是我的代码不起作用
from selenium import webdriver
from time import sleep
PATH = r"c:\Users\test\Desktop\chromedriver.exe"
driver = webdriver.Chrome(PATH)
driver.get("https://www.royalcasino.dk/spilleautomater/spil-for-sjov/european-roulette")
sleep(10)
saldo = driver.find_elements_by_xpath("//*")
for i in saldo:
print(i.text)
print(saldo.text)
exit()
我想收到的价值变化很大
当我运行它输出的程序时,网站上的所有文本,但只有静态文本,这是否导致无法从 selenium 读取动态文本?
解决方案
似乎您的元素目标具有多个类名text
并且value
:
<span class="text value"> Small </span>
.find_element_by_class_name
仅用于单个类名。
而是使用.find_element_by_css_selector
:
saldo = driver.find_element_by_css_selector('.text.value')
print(saldo.text)
#更新
要获取DKK 5.000,00
您的意思的文本,您可以使用此 xpath:
//span[contains(text(), "Saldo")]//following-sibling::span[@class="text value" and text()!=""]
但是你已经<iframe>
嵌套在页面中,你需要先切换它。并使用WebDriverWait
而不是sleep(...)
.
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
PATH = r"c:\Users\test\Desktop\chromedriver.exe"
driver = webdriver.Chrome(PATH)
driver.get('https://www.royalcasino.dk/spilleautomater/spil-for-sjov/european-roulette')
wait = WebDriverWait(driver, 60)
wait.until(EC.frame_to_be_available_and_switch_to_it((By.ID, 'GameflexWidget-1')))
wait.until(EC.frame_to_be_available_and_switch_to_it((By.ID, 'GameObjectContainer')))
element = wait.until(EC.presence_of_element_located((By.XPATH, '//span[contains(text(), "Saldo")]//following-sibling::span[@class="text value" and text()!=""]')))
print(element.text)
driver.quit()
推荐阅读
- sql-server - 如何在不删除表、分区方案和分区函数的情况下,在 SQL Server 中的分区表的下端和末尾添加空文件组?
- mysql - 即使停止运行 Spring,如何实现持久性?
- javascript - jConfirm 显示 [object Object] 而不是字符串作为消息
- python - 挖掘数据框以获取唯一字数
- javascript - 锚点覆盖并且没有正确改变颜色,因为不能完全点击
- angular - 从源“http://localhost:4200”访问“http://localhost:9090/api/auth/produits/files”的 XMLHttpRequest 已被 CORS 策略阻止
- java - 如何解析 String.format 将 0 添加到 int
- blazor - 如何在 Blazor 中实现路由守卫?
- java - 尝试用 Java 编写一个方法,该方法将搜索数据库列表并返回一个 Customer 对象,给定一个 customerID
- java - 正则表达式仅在未转义时才匹配字符串中的字符