javascript - 单击按钮,然后使用 Google Apps 脚本进行抓取
问题描述
我有抓取以下URL的权限。
它包含一个 HTML 表格,当它变得太大时,它会分成页面。如果我单击下一页的链接,则 URL 没有变化,新内容只是加载到网站中。
Google Apps 脚本有没有办法:
- 单击具有这些特征的按钮
- 等待内容加载
- 继续刮?
到目前为止,这是我用于抓取的内容:
var response = UrlFetchApp.fetch(url);
var $ = Cheerio.load(response.getContentText());
以防万一,这是包含分页按钮的 DIV:
<div class="paginacion aleft">
<span>
<span id="ContentPlaceHolder1_ContentPlaceHolder1_ContentPlaceHolder1_pager_rptPager_current_0" class="actual">1</span>
<a id="ContentPlaceHolder1_ContentPlaceHolder1_ContentPlaceHolder1_pager_rptPager_page_1" href="javascript:__doPostBack('ctl00$ctl00$ctl00$ContentPlaceHolder1$ContentPlaceHolder1$ContentPlaceHolder1$pager$rptPager$ctl02$page','')">2</a>
<a id="ContentPlaceHolder1_ContentPlaceHolder1_ContentPlaceHolder1_pager_rptPager_page_2" href="javascript:__doPostBack('ctl00$ctl00$ctl00$ContentPlaceHolder1$ContentPlaceHolder1$ContentPlaceHolder1$pager$rptPager$ctl03$page','')">3</a>
解决方案
推荐阅读
- c# - 如何通过列表
从 C# 到 C++ CLi? - c - 了解如何使用 C 中的位运算符计算数字的尾随零
- azure-devops - 如何设置条件以避免重复运行为用户故事创建任务
- lte - LTE中集中式无线资源管理与分布式无线资源管理的区别
- c# - 在 IE 中安装 activeX 时如何修复“读取设置初始化文件时出错”?
- python - 如何使用 Keras 生成器选择 batch_size、steps_per_epoch 和 epoch
- kubernetes - Alb Ingress Controller target-type:instance 如何转发请求
- php - 如何插入库存数量并更新到另一个表中?
- python - 解决异常时如何知道哪个参数有错误消息?
- java - 无法从领事注销服务(Spring Boot 应用程序)