javascript - Puppeteer:获取网页的完整 HTML 内容,如 innerHTML,但包括任何影子根?
问题描述
在 Puppeteer 中浏览页面时,我通常可以将完整的 HTML 内容作为文本获取,如下所示:
var content = await page.evaluate(
() => document.querySelector('body').innerHTML );
但是,我目前正在处理存在多个嵌套阴影根的情况。所以我假设我必须遍历整个 DOM 并检查每个节点是否有任何.shadowRoot
可用并分别遍历这些 DOM。
有没有捷径或更简单的方法来做到这一点?像innerHTML
包含任何 shadowroot DOM 的变体一样?
解决方案
推荐阅读
- python - matplotlib fill_between:填充间隙
- multithreading - 如何确保一段代码在任何给定时间总是被一个线程使用?
- bootstrap-4 - 使用 aria-expanded="true" 的 Bootstrap Collapse 无法按预期工作
- python - 某些 Celery 任务启动但挂起并且从不执行
- reactjs - 在 Reactjs 中使用 HTML5 音频标签
- r - 使用数据列中的信息生成输出(字符操作(求和等))
- python - 交错不同长度的 TFRecordDatasets
- r - “条件的长度> 1,并且只使用第一个元素”来自嵌套“if elses”的警告在数据帧上
- javascript - 使用 onEdit 函数获取范围时遇到问题
- python - OneHotEncoding (sklearn) 和 get_dummies (pandas) 之间的差异