xpath - 无法在 Google 电子表格上使用 Importxml 获取 /a/@href 元素
问题描述
有人可以帮我看看在这个网站http://tuscanwillowick.com/上工作的 Xpath 是什么,以提取所有外部链接。
这是我在其他网站上使用的,效果很好:“//a[contains(@href, '/') 而不是(contains(@href, '@'))]/@href")。
我不明白这个网站有什么不同。
谢谢。
解决方案
该网站用于Javascript
显示数据。它不会开箱即用Google Sheets
。您可以使用Selenium
刮擦这个或类似的工具。
如果你真的想用 GS 做这个,你可以使用ImportfromWeb插件(免费计划中请求的数量是有限的)。您必须指定使用jsrendering
.
以下 XPath 将选择您要查找的内容(所有外部链接):
//a[not(starts-with(@href,"http://tuscanwillowick.com/"))][contains(@href,"http")]/@href
C6 中的公式:
=IMPORTFROMWEB(C2;C3;B4:C4)
输出 :
推荐阅读
- r - 在 R 中查看最佳 dtw 对齐
- python - 如何将输入转换为小写
- reporting-services - 在分组和行号方面需要帮助
- excel - 将文件保存到新驱动器后使用 Shell 运行批处理文件
- ios - 带有日期、小时、分钟和秒的 UIDatePicker
- jhipster - 在 Jhipster 应用程序中添加新的 bootswatch 主题
- angular - 使用 Angular 的 HttpClient 进行同步调用的最佳方式是什么?
- mysql - 如何获取mysql表中一行的分区名称
- visual-studio-code - 如何匹配文本伴侣语法中后跟冒号的字符串(或者如果更容易,则在前面)
- c# - C# XNode 添加一个 NameSpace