首页 > 解决方案 > 抓取 Spectrum 社区数据的最佳方式是什么?

问题描述

我想抓取 Spectrum 频道数据。我正在考虑使用抓取工具,例如Puppeteer以用户身份登录并抓取某个频道。我能想到的一个问题是,在我加入之前,我可能无法访问所有聊天记录的历史记录。你怎么解决这个问题?

标签: web-scrapingpuppeteer

解决方案


在该站点上创建一个用户,然后在抓取代码中使用这些凭据。它将具有所需的所有访问权限。我使用了 HtmlAgilityPack,我觉得它非常适合这个。

https://www.nuget.org/packages/HtmlAgilityPack/


推荐阅读