首页 > 解决方案 > 使用 Google 表格 + IMPORTXML 提取财务报表数据

问题描述

我正在尝试将几千家公司上一季度的研发费用从他们的财务报表中导入到谷歌表格中。虽然我想从财务报表中导入几个不同的元素,但上一季度的研发费用目前是相关的(可能是前三个季度)。

我尝试了几个不同的网站(雅虎财经、Bloomberg 等),但最简单的 URL 似乎来自 stockrow.com,因为我可以简单地自动替换 URL 中的股票代码。

要获取 xpath,我检查元素并使用浏览器复制 xpath(已尝试使用 Chrome 和 Firefox)。

我在 googlesheets 上使用 IMPORTXML,并且在我最后一次尝试中,使用了以下输入: =IMPORTXML("https://stockrow.com/JNJ/financials/income/quarterly","/html/body/div[1]/div/div/section/div/div[2]/div[1]/section[4]/div/div[3]/div/div/div[3]/div/div/div[11]/div/span")

我尝试了与元素相关的各种站点、浏览器和 xpath 组合,但无论我做什么,我总是得到相同的错误“导入的内容为空”。

我阅读了xpath google sheet importxml,但无法理解 xpath 发生的变化或如何解决这一特殊挑战。

因为我希望这可以在谷歌表格中的多个股票代码中重复,我希望研发费用的“位置”(以及财务报表中的其他元素)在所有页面上都是一致的,而不仅仅是对此的特定解决方案挑战。

期待得到指导。谢谢!!

标签: xpathweb-scrapinggoogle-sheetsgoogle-sheets-formulagoogle-sheets-importxml

解决方案


你需要一些其他的来源。Google 表格不支持抓取 JavaScript 元素。您可以简单地通过禁用给定站点的 JS 来测试 JS 依赖关系,剩下的可以被刮掉。在你的情况下它什么都没有:

0


推荐阅读