javascript - 有没有办法对网站上的每个页面进行截图?
问题描述
我们有几个旧网站正在进行升级。能够截取每个页面然后 md5 将两个域的结果相加,然后测试呈现的所有内容是否 100% 匹配,这将很有用。
我不确定如何执行此操作 - 我们查看了cheerio
哪些会抓取该网站但无法截屏,以及可以截取屏幕截图但不能抓取该网站的 nightwatch。有没有人有这样做的经验?
解决方案
一个简单的解决方案是在无头模式下使用 Chrome,它也可以通过Puppeteer等许多 Node 模块进行控制。
取自谷歌开发者页面:
chrome --headless --disable-gpu --screenshot https://www.chromestatus.com/
关于抓取,您可以混合使用 Cheerio 和 Puppeteer 来抓取链接并截取屏幕截图。或者,您可以找到一些允许导出包含所有网站 URL 的站点地图(示例)的工具,此时应该很容易遍历它们并截取每个 URL。
推荐阅读
- ruby-on-rails - 在 Active Admin Rails 中创建新项目时过滤下拉列表
- applescript - 使用 applescript 清除 ITerm2 缓冲区
- appcelerator - 容器视图中的 Appcelerator 菜单
- java - 如何从覆盖方法java调用值?
- java - 在具有身份验证的代理后面使用 Azure EventHub
- python - 在 Django StaticLiveServerTestCase 中提交使用 Intercooler 的表单
- python-3.x - 在python中使用opencv按面积查找第二大轮廓及其内部轮廓
- python - Try/catch 块显示 TypeError: until_not() missing 1 required positional argument: 'method'
- r - 将嵌套列表中的元素传递给 renderUI
- c# - 在 C# 中异步等待事件