首页 > 解决方案 > 我可以在不使用 HtmlAgilityPack 之类的 3rd 方库的情况下抓取 HTML 类吗?

问题描述

我想制作一个程序,在 imgur.com 上读取相册的描述(例如:https ://imgur.com/gallery/DsAE9cv )

该元素将是

<div class="post-image-description">One owner?</div> 

但我很难得到描述(一个所有者)。

获得一些提示会非常有帮助!

我尝试使用 HtmlAgilityPack 和 XPath,但它不起作用。

string link = txt_Link.Text;

var web = new HtmlAgilityPack.HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load(link);

var description = doc.DocumentNode.SelectSingleNode("/html[1]/body[1]/div[8]/div[2]/div[2]/div[2]/div[1]/div[2]/p[1]");

txt_Return.Text = description.ToString();

我期待“一个所有者?”的输出。但我得到“NULL”(文本框显示“HtmlAgility.Node”。

标签: c#web-scraping

解决方案


description.ToString()不返回预期结果。

使用description.InnerText属性查看标题。

返回“一个所有者?” 在你的例子中。


推荐阅读