xml - 将 XML 数据从基于 Web 的源导入 Google 表格
问题描述
我正在尝试构建一个 Google 表格,该表格从通过 AWS S3 托管的 IRS 表格 990 存储库中提取信息。
这是 XML 文件:XML中的示例 990 表单
我正在执行的查询旨在从 XML 源中提取附表 I 部分下的企业名称。企业名称包含在BusinessNameLine1Txt
标签中。
利用 Google Sheet 中的内置IMPORTXML
函数,我构建了以下内容:
=IMPORTXML("https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml", "//Return/ReturnData/IRS990ScheduleI/RecipientTable/RecipientBusinessName/BusinessNameLine1Txt")
当我使用上面看到的参数执行函数时,我收到一条错误消息,指出导入的内容为空。我的 XPATH 查询不正确还是与数据中的一些怪癖有关?
解决方案
这个改装怎么样?
=IMPORTXML(A1, "//*[local-name()='BusinessNameLine1Txt']")
https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml
放在“A1”中。
结果:
参考:
如果我误解了你的问题,请告诉我。我想修改它。
编辑:
=IMPORTXML(A1, "//*[local-name()='IRS990ScheduleI']//*[local-name()='BusinessNameLine1Txt']")
结果:
推荐阅读
- struts2 - xwork2.ActionSupport 应用程序启动后循环
- python-3.x - 如何使我的算法与 KNN 文本分类一起使用?
- javascript - 延迟加载图像未在谷歌中编入索引
- node.js - 如何将这两个单独的聚合查询合并为一个查询?
- c# - 如果列包含数组中的任何一个元素,则过滤数据表
- cvxr - 在 CVXR 中编写目标函数
- vsto - Outlook 插件找不到 \\localhost\C$ 路径
- windows - 是否可以将 DAQ 生成的数据实时流式传输到其他地方?
- validation - tf.keras.metrics.MeanIoU 与 sigmoid 层
- c++ - 我们可以将值存储到空位置吗?