首页 > 解决方案 > 网页抓取 Google 表格脚本

问题描述

我正在尝试将基于“A”列的数据输入“B”列。如果“A”是网站 url 的完整列表,是否可以运行一个脚本来抓取电话号码,例如,从这些网站中抓取电话号码并输入到“B”列?

我是 100% 的脚本新手,但很想了解它是如何工作的。

标签: web-scrapinggoogle-sheets

解决方案


假设每个单元格Column A是一个 url,你绝对可以抓取电话号码。

在此处输入图像描述

实现这一点的代码:

  • 提取网页的文本(假设电话号码不是链接或其他内容)
  • 使用正则表达式在该文本中搜索电话号码。
B2: =JOIN("|",IMPORTXML(A2,"//a/@href"))
C2: =REGEXEXTRACT(B2,"[0-9]{3}[- ]*[0-9]{3}[- ]*[0-9]{4}")

推荐阅读