javascript - APIFY 中的 scrapeAndClick 函数
问题描述
我在 APIFY 中遇到了以下问题。我想编写一个函数来保存当前页面的 HTML 正文,然后单击到下一页,保存 HTML 正文等。
我试过这个:
var result = [];
var scrapeAndClick = function() {
$("div.ui-paginator.ui-paginator-top.ui-widget-header.ui-corner-top").each(function() {
result.push(
$(this).html()
);
//klikej na dalsi stranky
var nextButton = $('a.ui-paginator-next.ui-state-default.ui-corner-all');
console.log('Click next button');
nextButton.click().delay(4000)
});
};
scrapeAndClick();
在 Google Chrome 控制台中,它只返回第一页的 HTML 正文。APIFY 不返回任何内容。
谁能看到,问题出在哪里?
如果有人对整个 Page 功能感兴趣:
async function pageFunction(context) {
const { log } = context;
const searchSelector = 'div.ui-panel-content.ui-widget-content > button';
//vyber "Gemeenschappelijk Landbouw Beleid" z Kies subsidie:
const subsidySelector = $("span.column2 > select.jsTruncate").val("10000");
log.info('Select CAP ')
subsidySelector
//klikni na Zoek
log.info('Click search.')
$(searchSelector).eq(0).click()
//loopujeme dalsi stranky a ukladame html body
var result = [];
var scrapeAndClick = function() {
$("div.ui-paginator.ui-paginator-top.ui-widget-header.ui-corner-top").each(function() {
result.push(
$(this).html()
);
//klikej na dalsi stranky
var nextButton = $('a.ui-paginator-next.ui-state-default.ui-corner-all');
console.log('Click next button');
nextButton.click().delay(4000)
});
};
scrapeAndClick();
return result;
}
StartURL 是这样的:https ://mijn.rvo.nl/europese-subsidies-2017
我在 APIFY 论坛(https://forum.apify.com/t/clickable-link-that-doesnt-change-the-url/361/3)上发现了一个老问题,但似乎是在旧版本上完成的APIFY 爬虫。
非常感谢您的帮助!
解决方案
推荐阅读
- javascript - 如何将外部 js 文件集成到 Angular 6 中。特别是将 Angular 质粒集成到 Angular 6 中
- php - 无法通过 XAMMP 使用 PHP 连接到 Oracle Database 11g
- php - 使用 CURL 向 SSL 认证域发送 post 请求
- php - 无法在 Excel::load() 之外获取对象名称值
- ajax - 如何更改日期格式 Ajax codeigniter 记录列表..?
- java - 如何使用 JAVA 从 XML 中获取特定的整个标签值
- python - 如何在 GPU 的支持下运行 python 代码
- ios - Swift 4 - 使用 URLSession 获取上传图像进度
- c# - 将 selectedItem 传递给下一个控制器
- java - 从 Docker 容器访问主机 Java