首页 > 解决方案 > 加载 html 页面并运行 datalayer.push 脚本后,如何使用 javascript 抓取数据层中存在的数据?

问题描述

我一直在学习 node.js 环境中的网络抓取,使用请求和cheerio 库从加载的页面中选择各种元素。

我在页面源代码中的许多页面上注意到,很多数据是使用 datalayer.push 脚本推送到数据层中的。大概与 Google Tag Manager/Google Analytics 一起使用。

如果我在 Chrome 中加载页面并打开开发者工具/选择控制台,我可以键入 datalayer 并查看存在的结构化数据。

请参阅下面的屏幕截图。

问题 如果我只对用于网络抓取目的的数据层感兴趣......

是否可以在 javascript 中访问该页面的“数据层”中保存的各种数据元素?

谢谢

此处为开发者工具控制台屏幕截图

标签: javascriptweb-scrapingcheeriogoogle-datalayer

解决方案


推荐阅读