html - 如何从 HTML 中识别静态资产
问题描述
我的任务是列出网页中的所有静态资产。我知道静态资产是那些在运行时永远不会改变的文件。
是否有系统的方法可以将这些与动态文件区分开来?
如果我必须列出所有静态资产。最好的起点是什么?
解决方案
从客户端的角度来看,没有系统的方法来确定 html 响应的哪一部分来自静态文件或在运行时由服务器生成。html 标准并没有那么大的不同。
话虽如此,大多数时候您可以猜测响应的哪一部分来自静态文件。当 html 响应 .css、.js、.gif 等文件的链接时,很有可能来自静态文件。
但是无法确定哪个 html 元素来自磁盘上的文件以及哪个是在运行时构建的。
系统的方法是分析形成 html 响应的代码,并从那里确定哪些资源是静态的,哪些是动态的。
编辑 您补充说您不需要100%。如果您不需要,那么也许您可以使用cloudflare 的文件扩展列表。cloudflare 默认缓存这些扩展的原因是它们通常是静态的。
推荐阅读
- java - 如何创建优化/组合图块集中图块的算法
- node.js - 如何从获取请求中返回原始 XML?
- discord - discord.py-rewrite - 覆盖命令冷却的最佳方法
- css - ion-item 内的 Ionic 4 ion-skeleton 未填充项目空间
- ruby - 为什么某些 ruby 整数不是 Marshal 可转储 to_json
- php - 如何使用 html 表上传 angular 和 laravel 中的多个文件?
- json - Api 响应和 Json laravel 格式
- github - 如何在 GitHub 中创建规则?
- vba - 选择所有没有 ActiveX 按钮的文本
- xamarin.forms - 如何通过 xamarin 表单共享文件(pdf、docx)