javascript - 加载 html 页面并运行 datalayer.push 脚本后,如何使用 javascript 抓取数据层中存在的数据?
问题描述
我一直在学习 node.js 环境中的网络抓取,使用请求和cheerio 库从加载的页面中选择各种元素。
我在页面源代码中的许多页面上注意到,很多数据是使用 datalayer.push 脚本推送到数据层中的。大概与 Google Tag Manager/Google Analytics 一起使用。
如果我在 Chrome 中加载页面并打开开发者工具/选择控制台,我可以键入 datalayer 并查看存在的结构化数据。
请参阅下面的屏幕截图。
问题 如果我只对用于网络抓取目的的数据层感兴趣......
是否可以在 javascript 中访问该页面的“数据层”中保存的各种数据元素?
谢谢
解决方案
推荐阅读
- random - 是否可以在 TI-Basic 中制作真正的随机数生成器?
- powershell - 在 jenkins 文件中编写 Powershell 或直接在 jenkins 中编写
- angular - 量角器测试在 Firefox 中失败,“HTTP 方法不允许”
- javascript - 有没有限制复选框类型选择的 jQuery 函数的替代方法?
- ruby-on-rails - “如何修复'错误:缺少必需的标志:»-a,--app APP应用程序运行命令'\”
- r - 在列表中查找对象的位置编号
- python - 关于动画中改变scatter的marker的问题
- c# - MongoDB Linq 嵌套子集合
- kubernetes - 使用 Helm 无需停机升级 Kubernetes 中的 jetstack cert-manager
- java - 余弦定律 JAVA