首页 > 解决方案 > Puppeteer:获取网页的完整 HTML 内容,如 innerHTML,但包括任何影子根?

问题描述

在 Puppeteer 中浏览页面时,我通常可以将完整的 HTML 内容作为文本获取,如下所示:

var content = await page.evaluate( 
  () => document.querySelector('body').innerHTML );

但是,我目前正在处理存在多个嵌套阴影根的情况。所以我假设我必须遍历整个 DOM 并检查每个节点是否有任何.shadowRoot可用并分别遍历这些 DOM。

有没有捷径或更简单的方法来做到这一点?像innerHTML包含任何 shadowroot DOM 的变体一样?

标签: javascripthtmlnode.jspuppeteer

解决方案


推荐阅读