首页 > 解决方案 > 使用 C# 从 HTML 中获取价值

问题描述

我目前正在开发一个带有条形码的库存管理系统。我找到了一个可以从中获取条形码信息的网站,它存储在 href 中。这是它的外观示例:

<a href="/ean/BarcodeNumber" target="_blank">ItemName</a>

我需要做的是获取项目名称,将其存储到字符串中,以便我可以更新标签。我遇到的主要问题是访问我的代码中的某些 HTML 标签。

有没有一种简单的方法可以从标签中获取“ItemName”?

谢谢

标签: c#

解决方案


我可以通过NuGet推荐Html Agility PackXPath的 简单示例:

var html = 
@"<html>
  <head>
  <title></title>
  </head>
  <body>
  <a href=""/ean/BarcodeNumber"">My Link Text</a>
  </body>
  </html>";

    var htmlDoc = new HtmlDocument();
    htmlDoc.LoadHtml(html);

    string name = htmlDoc.DocumentNode
                    .SelectSingleNode("//html/body/a[@href='/ean/BarcodeNumber']")
                    .InnerText;

推荐阅读