c# - 从站点 c# 获取 html
问题描述
我需要从这个页面解析一些数据https://warcraft3.info/replays/18723
只有 WebBrowser 可以帮助我获得更多的 html 部分,但我仍然无法获得所有 html 文本。但 WebBrowser 控件正确显示页面。
当我使用浏览器保存页面时,我得到了我需要的东西。
有人可以帮我一些建议吗?
var d = (wfhSample.Child as System.Windows.Forms.WebBrowser).Document.Body.OuterHtml;
解决方案
这是一个敏捷的 HTML 解析器,它构建一个读/写 DOM 并支持普通的 XPATH 或 XSLT(实际上你不必了解 XPATH 或 XSLT 就可以使用它,不用担心......)。它是一个 .NET 代码库,允许您解析“网络之外”的 HTML 文件。解析器对“真实世界”格式错误的 HTML 非常宽容。对象模型与 System.Xml 的提议非常相似,但用于 HTML 文档(或流)。
我个人将其用于不同的项目。它易于使用且友好。
推荐阅读
- android - 如何在另一个片段中显示时间选择器片段
- python - python中两个字符串的笛卡尔积
- python - 系列除以标量结果为 NaN/0
- angular - 带有全选复选框的 ag-grid 隐藏行仅适用于过滤后的项目
- light-4j - 是否有任何真正的轻量级 4j 示例用于将 json 请求映射到 Java POJO 对象?
- sql - 来自特定对象的 ActiveSupport 通知
- sonarqube - 带有 SonarQube 的 Python 项目的 Gitlab-CI
- php - 使用 php 保存登录表单数据
- azure - 应用服务应用程序在隐身模式或清除历史记录中提供 404
- javascript - 重定向更新的请求不显示