首页 > 解决方案 > 如何强制 WGET 命令不在响应中带上任何时间戳?

问题描述

我想定期获取远程网页的哈希值,然后比较当前和以前的哈希值以了解是否有任何变化。

为此,我使用该wget命令以递归方式检索数据。

我的要求是,只有当最终用户在浏览器中查看的网页内容发生某些变化时,我才需要获取不同的哈希值。

如果我执行一个简单的 wget 命令,例如

wget --recursive --page-requirements --convert-links URL/TO/WEBPAGE

响应将在标头中包含时间戳,并且每次我都会得到不同的哈希值。

cURL我可以设置一个选项以不获取任何标题作为响应,但我不知道如何强制执行wget

所以问题是我该怎么做才能使对wget命令的响应确实带来任何标题?

标签: httpcurlhttpshttp-headerswget

解决方案


将网页存储在一个文件中,并使用该文件来计算您的哈希值。

wget --recursive --page-requirements --convert-links -O /tmp/wget.txt URL/TO/WEBPAGE
md5sum /tmp/wget.txt

推荐阅读