首页 > 解决方案 > 无法在 Google 电子表格上使用 Importxml 获取 /a/@href 元素

问题描述

有人可以帮我看看在这个网站http://tuscanwillowick.com/上工作的 Xpath 是什么,以提取所有外部链接。

这是我在其他网站上使用的,效果很好:“//a[contains(@href, '/') 而不是(contains(@href, '@'))]/@href")。

我不明白这个网站有什么不同。

谢谢。

标签: xpathgoogle-sheets-importxml

解决方案


该网站用于Javascript显示数据。它不会开箱即用Google Sheets。您可以使用Selenium刮擦这个或类似的工具。

如果你真的想用 GS 做这个,你可以使用ImportfromWeb插件(免费计划中请求的数量是有限的)。您必须指定使用jsrendering.

以下 XPath 将选择您要查找的内容(所有外部链接):

//a[not(starts-with(@href,"http://tuscanwillowick.com/"))][contains(@href,"http")]/@href

C6 中的公式:

=IMPORTFROMWEB(C2;C3;B4:C4)

输出 :

IFW


推荐阅读