首页 > 解决方案 > 从站点 c# 获取 html

问题描述

我需要从这个页面解析一些数据https://warcraft3.info/replays/18723

只有 WebBrowser 可以帮助我获得更多的 html 部分,但我仍然无法获得所有 html 文本。但 WebBrowser 控件正确显示页面。
当我使用浏览器保存页面时,我得到了我需要的东西。
有人可以帮我一些建议吗?

 var d = (wfhSample.Child as System.Windows.Forms.WebBrowser).Document.Body.OuterHtml;

标签: c#html

解决方案


HTML 敏捷包

这是一个敏捷的 HTML 解析器,它构建一个读/写 DOM 并支持普通的 XPATH 或 XSLT(实际上你不必了解 XPATH 或 XSLT 就可以使用它,不用担心......)。它是一个 .NET 代码库,允许您解析“网络之外”的 HTML 文件。解析器对“真实世界”格式错误的 HTML 非常宽容。对象模型与 System.Xml 的提议非常相似,但用于 HTML 文档(或流)。

我个人将其用于不同的项目。它易于使用且友好。


推荐阅读