xpath - Google 表格 - 在特定页面上导入 XML 时遇到问题
问题描述
尝试在 Google 表格中使用 ImportXML 来检索特定的文本,但在搜索我的屁股以寻找答案后遇到了麻烦。
希望这里有人可以帮助解决问题。
该页面是:https://www.afi.com.au 我要导入的文本在粉红色框中:
这是我使用代码的地方,我试图检索 XPath,但它不喜欢我所拥有的,我相信这里有人会在心跳中发现问题......
=IMPORTXML("http://www.afi.com.au","//body[@class='entry-homepage type-homepage']/div[@class='page page-home']/div[@class='page__item']/div[@class='js-evo7-component']/div[@class='hero']/div[@class='hero__inner-root rellax']/div[@class='hero__inner']/div[@class='container']/div[@class='grid']/div[@class='grid__item one-third palm-one-whole']/div[@class='hero__share-price']/div[@class='price-number']//text()")
解决方案
这个解决方法怎么样?在此解决方法中,使用 xpath 检索数据,并使用正则表达式检索值。检索页面时似乎更新了检索到的数据。所以我用了这个方法。修改后的公式如下。请认为这只是几个答案之一。
示例公式:
在此示例公式中,http://www.afi.com.au
放在单元格“A1”中。
=REGEXEXTRACT(IMPORTXML(A1,"//div[@class='js-evo7-component']/@data-config"),"netAssetBacking"":{""price"":""([\d.]+)")
//div[@class='js-evo7-component']/@data-config
使用with的 xpath 检索数据IMPORTXML()
。netAssetBacking"":{""price"":""([\d.]+)
使用with的正则表达式检索值REGEXEXTRACT()
。
结果:
参考:
推荐阅读
- qt - Qt蓝牙:获取电池电量值通知
- android - 如何将 JSON 数据从 Activity 传递到 Fragment
- ssl - 生成没有配置文件的 OpenSSL CRL 文件
- r - 将 JSON 从文件读取到 tidyjson
- r - 如何解决 R 中的梵文脚本编码错误
- ios - SwiftUI:从导航栏按钮导航到下一个视图?
- c# - 使用不可见的滚动条滚动到页面底部
- email - 电子邮件消息:电子邮件消息的标题部分、电子邮件信封、电子邮件消息正文和 SMTP
- javascript - 如何从根应用程序开始导入?
- javascript - 如何修复 fsevents@2.1.3 不受支持的平台:想要 {"os":"darwin","arch":"any"}(当前:{"os":"win32","arch":"x64"})