javascript - 如何使用phantomjs从html源中提取元素?
问题描述
我正在尝试<div>
从此 html 中提取一些元素:
<html>
<head> ... </head>
<body>
<div>
<div class="app-wrapper">
<header class="position-sticky top-0 left-0 w-100 z-index-111 mb-20px"> ... </header>
<div class="app-content">
<div class="container">
<div class="rounded mb-10px bg-white">
<div class="d-flex flex-column flex-m-row p-m-14px">
... some html ...
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>
使用这个 PhantomJS 代码:
var webPage = require('webpage');
var page = webPage.create();
var link = " "
page.open(link, function (status) {
var elems = page.evaluate(function () {
return [].map.call(document.getElementsByClassName('d-flex flex-column flex-m-row p-m-14px'), function (elem) {
return elem.innerHTML
});
});
console.log(elems); //logs []
phantom.exit();
})
由于类中使用的样式,我认为它不会记录任何内容,但是将这个函数用于 app-wrapper 和 app-content 类也没有产生任何结果。它仅适用于容器类并返回一个包含单个元素的数组。为什么它不适用于其他两个班级?
解决方案
推荐阅读
- powerbi - 使用 DAX 来自不同列的累积值
- json - F#: How to deserialize a private discriminated union with Newtonsoft.Json?
- sql - 如何使用分区通过开始和结束日期创建日期范围?
- python - 如何使用 Python 在 Instagram 上上传视频?
- visual-studio - 打开 Visual Studio
- ssh - 使用 ssh 密钥登录到 windows openssh 服务器
- python - 如何从 beautifulsoup 页面获取所有产品
- css - 如何使用css nth-child(公式)选择偶数行中的所有项目
- python - 添加两个索引不等的数据框
- python - FileNotFoundError:[Errno 2] 没有这样的文件或目录:'data/top10_cities.csv/top10_cities.csv'