首页 > 解决方案 > 使用 HtmlAgilityPack 进行 C# 网页抓取

问题描述

我想在 WPF 中创建应用程序,它将从网页中抓取信息

我从顶部的文本框中阅读到页面的链接

我想从 h6 中提取公司名称

我不明白这种格式:“//h2[@class='card__title mdc-typography--headline6']”。我找不到文档 abot 表示 @ [] 等来创建另一个过滤器以从标签中抓取其他数据,例如电话号码。

标签: c#web-scrapinghtml-agility-pack

解决方案


XPath选择器的@, //, ...表示缩写语法。

  • @abc简称attribute::abc
  • //简称/descendant-or-self::node()/

因此,换句话说,您当前的查询//h2[@class='card__title mdc-typography--headline6']表示查找具有class属性的第一个后代或自身节点的操作card__title mdc-typography--headline6


推荐阅读