首页 > 解决方案 > 使用 Google 表格从网页抓取中提取链接文本

问题描述

我有以下<html>文字:

<a href="link.html" target="_parent">Text</a>

我应该如何获得“文本”值?我正在尝试这个,但我得到一个空值:

=INDEX(importxml("http://www.remoteurl.com";"//a[@href='link.html']");1)

标签: web-scrapinggoogle-sheets

解决方案


我尝试使用您的语法,它对我有用。出于测试目的,我将其缩短了一点。

=importxml("https://www.remoteurl.com","//a[@href='link.html']")

确保href您在 xpath 查询中传递的值与网页上的值完全相同,例如,如果网页使用相对路径,那么您也必须使用相同的相对路径。


推荐阅读