首页 > 解决方案 > javascript 对 html 进行更改后如何获取 html 源代码(没有浏览器)

问题描述

我想获取网页的 HTML 源代码。我知道我可以使用 HttpRequest 类(.NET Framework)来获取它,但不幸的是,HTML 尚未“完全形成”,因为我想要的 HTML 需要单击网页上的链接/按钮,然后才能操作HTML(那是我想要获取 HTML 源代码的时候)。

我试过使用WebBrowser类/控件(.NET Framework)。即使这可能允许我获取经过处理的 HTML 源,我尝试请求的网页也会有弹出窗口,而我不能有弹出窗口。有没有办法做到这一点?

标签: javascriptc#html

解决方案


如果您必须单击按钮、处理弹出窗口、发送帖子请求等。您应该看看 Selenium。它使您能够完全自动化浏览器并获取页面上的任何 html。您可以等待某些标签 id 存在,然后通过实例获取 html。Selinum 可以在没有 UI 的情况下运行浏览器,在 webdriver 上添加参数“--headless”。


推荐阅读