首页 > 解决方案 > 用于获取缺少单元格图像的表格行的 xpath

问题描述

我正在尝试使用 Xpath 抓取包含图像和文本的表格的行。只要图像出现在此页面上的第三张表格中,一切都会正常工作。但是,当此页面上的表格中缺少图像时,它将不起作用。我需要将图像与表数据的右行连接起来。

这是我在谷歌表格中使用的 xpath_query 字符串的类型,其中 A1 包含 url。

=importXML(A1,"//tbody//img/@src")
=importXML(A1,"//tbody//tr")

谢谢你的帮助。

标签: xpathweb-scrapinggoogle-sheetsgoogle-sheets-querygoogle-sheets-importxml

解决方案


像这样:

=ARRAYFORMULA(IMAGE("https://www.patentati.it"&TRIM(SUBSTITUTE(FLATTEN(
 SPLIT(QUERY(IFNA(REGEXEXTRACT(QUERY(ARRAY_CONSTRAIN(IMPORTDATA(A1), 500, 1), 
 "where Col1 matches '.*zoomImage.*|.*rowspan.*'"), 
 "src=""(.+png)"), "♀♫"),,9^9), "♫")), "♀", ))))

在此处输入图像描述


和一整张桌子:

=ARRAYFORMULA({{"figura"; IMAGE("https://www.patentati.it"&TRIM(SUBSTITUTE(FLATTEN(
 SPLIT(QUERY(IFNA(REGEXEXTRACT(QUERY(ARRAY_CONSTRAIN(IMPORTDATA(A1), 500, 1), 
 "where Col1 matches '.*zoomImage.*|.*rowspan.*'"), 
 "src=""(.+png)"), "♀♫"),,9^9), "♫")), "♀", )))}, 
 QUERY(IMPORTHTML(A1, "table", 1), "select Col2,Col3", 0)})

在此处输入图像描述


在此处输入图像描述


推荐阅读