selenium - 硒 aspx 结果
问题描述
我是 selenium 的新手,如果问题没有很好地形成,我深表歉意。我正在研究自动化一些数据收集。有一个 ASP.NET 站点,您可以在其中请求有关特定主题的数据。当数据查询完成时,网页将更新结果。当我使用 selenium 获取 page_source 时,我看不到数据。我相信它是在 __VIEWSTATE 中编码的。使用 IE DOM Explorer,数据以纯文本形式存在。
有没有办法从 DOM Explorer 中提取数据?基本上,我很乐意得到一个转储并自己解析它。
任何帮助将不胜感激。
解决方案
我想我想通了。感谢所有的投入。我从中得到了答案:通过 Selenium 抓取动态内容?
我最终做的是首先获取页面上的 iframe 列表
driver.find_elements_by_tag_name("iframe")
然后一次切换到每个 iframe。就我而言,第一个 iframe 是具有相关信息的 iframe:
driver.switch_to.frame(driver.find_elements_by_tag_name("iframe")[0])
一旦我进入相关框架,我就可以这样做:
html = driver.page_source
这会给我预期的结果。
看起来框架上下文很重要。一旦进入框架上下文,您就可以抓取数据。
推荐阅读
- swift - 如何快速裁剪图像
- python - sklearn 中的仅分类器管道
- javascript - 如何使用 gem 'jquery-validation-rails' 验证 AJAX 请求的表单
- python - 然后用输入替换列表中大于 100 的某些对象
- ios - 在 tableView 更新期间对数据源的线程安全访问
- mongodb - MongoDB:为嵌入式数组创建索引
- sql - 使一列自动,以便每次输入新记录时它可以增加一
- r - R 的控制流与多个 if 语句的行为不符
- linux-kernel - 如何在 beaglebone 自定义 linux 上自动连接 wifi
- promise - 使用 esri/request 触发的多个 XHR 请求在使用 dojo/promise/all 处理时返回延迟