首页 > 解决方案 > 来自 Etsy 的 Google Sheets ImportXML - 使用动态导航从多个页面导入数据

问题描述

我正在尝试使用 Google 表格从一些 Etsy 商店中抓取数据。具体来说,我希望在卖家的评论中导入产品名称(在这张照片中以红色勾勒)。我已经使用以下公式成功导入了这些名称,卖家的 Etsy URL ( https://www.etsy.com/shop/PaperLarkDesigns ) 位于单元格 B4 中:

=IMPORTXML(B4, "//div[@class='flag-body hide-xs hide-sm']")

但是产品评论的导航是动态生成的,因此该公式仅从评论的第一页导入标题,并且似乎没有将公式指向特定评论页面的 URL。

有没有办法表示 importXML 公式应该从哪一页评论中提取这些标题?还是不能使用这种类型的导航从站点中提取数据?

我不熟悉 Excel/Google 表格中更复杂的公式,所以提前感谢您的帮助!

标签: web-scrapinggoogle-sheetsgoogle-sheets-importxml

解决方案


不幸的是,IMPORTXML在这种情况下使用是不可能的。

根据IMPORTXML 文档

IMPORTXML从任何各种结构化数据类型中导入数据,包括 XML、HTML、CSV、TSV 以及 RSS 和 ATOM XML 提要。

因此,=IMPORTXML()您正在使用的命令读取HTML页面的源代码,而没有任何与之关联的 JavaScript 代码,也没有执行它——这就是您无法从中检索所需数据的原因。

参考


推荐阅读