c# - 获取页面上的所有链接 - HtmlAgilityPack
问题描述
我正在尝试使用 HtmlAgilityPack 从网页获取所有链接(a[href] 链接);
我的代码:
HtmlWeb web = new HtmlWeb();
HtmlDocument site = web.Load("https://www.google.com/");
HtmlNodeCollection links = site.DocumentNode.SelectNodes("//a[@href]");
foreach (HtmlNode link in links)
{
Console.WriteLine(link.GetAttributeValue("href", "DefaultValue"));
}
问题:我注意到我的代码没有从页面中获取“所有”链接并且错过了一些链接......
我用Java中的JSoup做到了这一点,它运行良好。(谷歌主页上有16个链接)但是HtmlAgilityPack我在同一页面上获得了13个链接......或者问题可能出在其他东西上......(有一个问题也有相对链接,但稍后会修复)
解决方案
推荐阅读
- ios - MSAL B2C PasswordReset 流导致“无效授权”错误
- r - UseMethod(“arrange_”)中的错误:没有适用于“arrange_”的方法应用于类“c('integer','numeric')”的对象
- php - openssl_decrypt 返回空白
- flutter - 如何将 Flutter syncfusion 日历与 jalali 日期一起使用
- html - 引导横幅与现有元素重叠
- branch - 我可以在没有触发器的情况下删除 ClearCase 分支上文件的版本 0 吗?
- c# - Rider Web 参考 .cs 文件为空
- javascript - 如何在本机反应中垂直对齐文本
- javascript - 为什么我的 jQuery Ajax json 数组数据会重复?
- python - 如何修复“py”不被识别为内部或外部命令、可运行程序或批处理文件