首页 > 解决方案 > 单击按钮,然后使用 Google Apps 脚本进行抓取

问题描述

我有抓取以下URL的权限。

它包含一个 HTML 表格,当它变得太大时,它会分成页面。如果我单击下一页的链接,则 URL 没有变化,新内容只是加载到网站中。

Google Apps 脚本有没有办法:

  1. 单击具有这些特征的按钮
  2. 等待内容加载
  3. 继续刮?

到目前为止,这是我用于抓取的内容:

var response = UrlFetchApp.fetch(url);
var $ = Cheerio.load(response.getContentText());

以防万一,这是包含分页按钮的 DIV:

<div class="paginacion aleft">
        <span>

        <span id="ContentPlaceHolder1_ContentPlaceHolder1_ContentPlaceHolder1_pager_rptPager_current_0" class="actual">1</span>
        
        

        
        <a id="ContentPlaceHolder1_ContentPlaceHolder1_ContentPlaceHolder1_pager_rptPager_page_1" href="javascript:__doPostBack('ctl00$ctl00$ctl00$ContentPlaceHolder1$ContentPlaceHolder1$ContentPlaceHolder1$pager$rptPager$ctl02$page','')">2</a>
        

        
        <a id="ContentPlaceHolder1_ContentPlaceHolder1_ContentPlaceHolder1_pager_rptPager_page_2" href="javascript:__doPostBack('ctl00$ctl00$ctl00$ContentPlaceHolder1$ContentPlaceHolder1$ContentPlaceHolder1$pager$rptPager$ctl03$page','')">3</a>

标签: javascripthtmlgoogle-apps-scriptweb-scraping

解决方案


推荐阅读