首页 > 解决方案 > Google 表格 - 在特定页面上导入 XML 时遇到问题

问题描述

尝试在 Google 表格中使用 ImportXML 来检索特定的文本,但在搜索我的屁股以寻找答案后遇到了麻烦。

希望这里有人可以帮助解决问题。

该页面是:https://www.afi.com.au 我要导入的文本在粉红色框中:

在此处输入图像描述

这是我使用代码的地方,我试图检索 XPath,但它不喜欢我所拥有的,我相信这里有人会在心跳中发现问题......

=IMPORTXML("http://www.afi.com.au","//body[@class='entry-homepage type-homepage']/div[@class='page page-home']/div[@class='page__item']/div[@class='js-evo7-component']/div[@class='hero']/div[@class='hero__inner-root rellax']/div[@class='hero__inner']/div[@class='container']/div[@class='grid']/div[@class='grid__item one-third palm-one-whole']/div[@class='hero__share-price']/div[@class='price-number']//text()")

标签: xpathweb-scrapinggoogle-sheetsgoogle-sheets-formulagoogle-sheets-importxml

解决方案


这个解决方法怎么样?在此解决方法中,使用 xpath 检索数据,并使用正则表达式检索值。检索页面时似乎更新了检索到的数据。所以我用了这个方法。修改后的公式如下。请认为这只是几个答案之一。

示例公式:

在此示例公式中,http://www.afi.com.au放在单元格“A1”中。

=REGEXEXTRACT(IMPORTXML(A1,"//div[@class='js-evo7-component']/@data-config"),"netAssetBacking"":{""price"":""([\d.]+)")
  1. //div[@class='js-evo7-component']/@data-config使用with的 xpath 检索数据IMPORTXML()
  2. netAssetBacking"":{""price"":""([\d.]+)使用with的正则表达式检索值REGEXEXTRACT()

结果:

在此处输入图像描述

参考:


推荐阅读