c# - 时间:2019-05-10 标签:c#htmlagilitypack,Page not Found
问题描述
我正在尝试使用 Htmlagility C# 加载以下网站的页面源,它总是返回“找不到页面”,但是当我在普通浏览器(chrome)中打开它时,它会显示所有内容。
HtmlAgilityPack.HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc = web.Load("http://www.alfatah.pk/");
解决方案
我的代码也收到了 404。不知何故,他们意识到我们不是人类,而是网络机器人!
这对我有用:
HtmlAgilityPack.HtmlWeb web = new HtmlWeb();
web.UserAgent="Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:63.0) Gecko/20100101 Firefox/63.0";
web.PreRequest += (request) =>
{
request.Headers.Add(HttpRequestHeader.Accept, "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8");
request.Headers.Add(HttpRequestHeader.AcceptLanguage, "de-DE");
return true;
};
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc = web.Load("http://www.alfatah.pk/");
推荐阅读
- swiftui - SwiftUI 和多个选择器
- java - 复制文件后如何释放docker的内存?
- javascript - 为什么 position().top 在第二个表中返回错误的值?
- javascript - 接下来实施中间件有错误
- c++ - 如何理解 flex C/C++ 字符串文字正则表达式?
- python - 通过命令行将 CSV 文件转换为具有相同列数的 CSV
- javascript - 使用纯javascript而不是jquery将数据发送到php
- ssl - 如何使用通配符证书
- javascript - 使用 ngFor 循环时,Themepunch 旋转滑块无法正常工作
- javascript - 如何从 textarea 中获取突出显示的文本位置?