javascript - javascript 对 html 进行更改后如何获取 html 源代码(没有浏览器)
问题描述
我想获取网页的 HTML 源代码。我知道我可以使用 HttpRequest 类(.NET Framework)来获取它,但不幸的是,HTML 尚未“完全形成”,因为我想要的 HTML 需要单击网页上的链接/按钮,然后才能操作HTML(那是我想要获取 HTML 源代码的时候)。
我试过使用WebBrowser
类/控件(.NET Framework)。即使这可能允许我获取经过处理的 HTML 源,我尝试请求的网页也会有弹出窗口,而我不能有弹出窗口。有没有办法做到这一点?
解决方案
如果您必须单击按钮、处理弹出窗口、发送帖子请求等。您应该看看 Selenium。它使您能够完全自动化浏览器并获取页面上的任何 html。您可以等待某些标签 id 存在,然后通过实例获取 html。Selinum 可以在没有 UI 的情况下运行浏览器,在 webdriver 上添加参数“--headless”。
推荐阅读
- c# - 如何将问题跟踪器(包、功能、支持)添加到现有项目?
- c# - getById 函数在存储库模式中采用一个或多个键
- html - 对 div 和图像的悬停效果在 css 中不起作用
- jenkins - Jenkins 中的配置全局安全性中缺少 JNLP 端口
- python - 替换“。” 使用 numpy 将十进制数写入文件时使用“,”
- apache-kafka - 处理来自 Kafka 的消息时避免数据丢失
- python - 设置 PyCharm 远程 conda 解释器
- java - SharedPreferences 返回错误值
- angular - 特定实体的大量动作/效果
- c# - 读取 ID 值始终为 0