首页 > 解决方案 > 将 XML 数据从基于 Web 的源导入 Google 表格

问题描述

我正在尝试构建一个 Google 表格,该表格从通过 AWS S3 托管的 IRS 表格 990 存储库中提取信息。

这是 XML 文件:XML中的示例 990 表单

我正在执行的查询旨在从 XML 源中提取附表 I 部分下的企业名称。企业名称包含在BusinessNameLine1Txt标签中。

利用 Google Sheet 中的内置IMPORTXML函数,我构建了以下内容:

=IMPORTXML("https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml", "//Return/ReturnData/IRS990ScheduleI/RecipientTable/RecipientBusinessName/BusinessNameLine1Txt")

当我使用上面看到的参数执行函数时,我收到一条错误消息,指出导入的内容为空。我的 XPATH 查询不正确还是与数据中的一些怪癖有关?

标签: xmlxpathamazon-s3google-sheetsgoogle-sheets-formula

解决方案


这个改装怎么样?

=IMPORTXML(A1, "//*[local-name()='BusinessNameLine1Txt']")
  • https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml放在“A1”中。

结果:

在此处输入图像描述

参考:

如果我误解了你的问题,请告诉我。我想修改它。

编辑:

=IMPORTXML(A1, "//*[local-name()='IRS990ScheduleI']//*[local-name()='BusinessNameLine1Txt']")

结果:

在此处输入图像描述


推荐阅读