web-scraping - 使用 Google 表格从网页抓取中提取链接文本
问题描述
我有以下<html>
文字:
<a href="link.html" target="_parent">Text</a>
我应该如何获得“文本”值?我正在尝试这个,但我得到一个空值:
=INDEX(importxml("http://www.remoteurl.com";"//a[@href='link.html']");1)
解决方案
我尝试使用您的语法,它对我有用。出于测试目的,我将其缩短了一点。
=importxml("https://www.remoteurl.com","//a[@href='link.html']")
确保href
您在 xpath 查询中传递的值与网页上的值完全相同,例如,如果网页使用相对路径,那么您也必须使用相同的相对路径。
推荐阅读
- r - 调度任务以运行同一 R 脚本的多个重叠实例
- bash - 用于根据时间检查文件的 Bash 脚本
- sabre - 使用相同的 PCC 代码在 Sabre Red 内预订
- javascript - 将对象数组转换为转置的对象数组
- linux - 在 Centos 上构建,安装 PerlIO::gzip 时出现 Zlib.h 错误
- javascript - Vue 和 rails:共享 cookie
- java - 如何在 android/java 中恢复新实例
- android - java.lang.RuntimeException:IllegalAccessException
- python - 在前几行上打印
- java - 在应用程序模块中使用库模块的依赖项