首页 > 解决方案 > C# 从浏览器窗口抓取 HTML

问题描述

我希望能够以某种方式访问​​打开的 Web 浏览器(如 Chrome 或 Firefox)并从中获取 HTML 文本。然后在我的 C# 程序中加载这个 HTML 并从中读取重要的内容。这应该每秒发生一次。

我需要采用这种不寻常的方式的原因是,我不能使用 WPF 中集成的 webbrowser,因为我要解析的网站说浏览器太旧了。CEFSharp Webbrowser 在 99% 的情况下都可以正常工作,我目前正在使用此浏览器执行此操作,但它无法处理传入的 H.264 Webcamstream 女巫是一个危险信号。

所以我不知道如何强制 cefbrowser 达到 100% 的可用性。这就是为什么我迫切需要我给小费或来自你们的提示,我可以从我的 chrome 浏览器中获取 HTML 文本。

谢谢你的帮助=)

标签: c#htmlbrowserscreen-scrapingcefsharp

解决方案


我最好的方法是硒。我使用 chromewebdriver 启动 chrome 浏览器,然后我可以从中获取我的东西。


推荐阅读