python - Python Selenium,page_source即使在页面完全加载后也没有保存完整的html页面内容
问题描述
问题
我怎样才能确保page_source
在完全加载时保留此网页的整个 html 内容?
问题描述
我正在尝试下载一些基因并自动化硒过程。我有许多基因,我想在基因摘要页面上下载csv摘要。
这是基因摘要页面的示例链接,其中下载和 csv 按钮以红色突出显示。 http://research-pub.gene.com/BrainMyeloidLandscape/BrainMyeloidLandscape2/#Human-gene/Human-gene/100034743/geneReport.html
当我加载网页甚至等到它完全下载时,driver.page_source
即使页面已完全加载,其内容中也不包含按钮类,我可以检查元素并找到它。
下载按钮类。
<i class="fa fa-download fa-fw"></i>
我想找到并模拟点击的实际 csv 按钮。
<a href="#" class="ep-download" data-download-csv="">.csv</a>
我知道一些答案说要实现WebDriverWait
,但即使实现了page_source
,也不包含我正在寻找的类。如何确保page_source
保存此网页的整个 html 内容?
这是我的示例代码:
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get('http://research-pub.gene.com/BrainMyeloidLandscape/BrainMyeloidLandscape2/#Human-gene/Human-gene/23550/geneReport.html')
print(driver.title)
print(driver.current_url)
#just to see what is initially saved in page_source
print(driver.page_source)
wait = WebDriverWait(driver, 10)
element = wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'fa fa-download fa-fw')))
#wanted to see what is saved after, and the whole page doesn't show
print(driver.page_source)
解决方案
推荐阅读
- mysql - 用于返回没有活动组成员身份的用户的 SQL 查询
- java - 如何将 Liquibase 与 Spring-Boot JPA 和 Maven 一起使用来管理来自 JPA 实体的迁移
- ruby-on-rails - ArgumentError:升级 Rails 6.1.3 时出现错误数量的参数错误
- powershell - 如何传入 .txt 文件以在 PowerShell 中创建类型字符串列表
- flutter - 无法在字段初始化程序中访问“this”以读取“assists”
- javascript - Firebase Emulator 无法在 Firefox 中建立连接
- r - 获取 R 中的估计后边际概率
- javascript - Javascript 在鼠标状态为“保持”时调用函数
- react-native - 更改子组件的 props 值导致渲染过多
- matlab - Matlab:细胞结肠的新希望?