首页 > 解决方案 > 所有 XML 元素标记中的 URL

问题描述

我在 Python 中使用 cElementTree 包,但遇到了元素标签的问题。它们在标签本身中包含一个属性。似乎是解析器的问题。请查看以下代码:

from xml.etree import cElementTree as ET
path='C:\\Users\\myusername\\Desktop\\test.xml'
tree=ET.parse(path)
root=tree.getroot()

root.tag
>>> '{http://www.aftmark.org}DATA'

xml是这样的:

<DATA xmlns:xsd="http://www.w.org/2008/XMLsca" xmlns="http://www.aftmark.org">
  <Header>
    <DATAVersion>6.5</DATAVersion>
  </Header>
  <Items>
    <Item MaintenanceType="A">
      <HazardousMaterialCode>N</HazardousMaterialCode>
      <ExtendedInformation>
    </Item>

知道为什么包含 url '{ http://www.aftmark.org }' 吗?我正在解析很多文件并且该网址发生了变化。DATA 标签没有。(备份是使用 root.tag 并获取该 url 并将其附加到所有 ET.find() 稍后)谢谢!

标签: pythonxmltagscelementtree

解决方案


这是因为DATA(和所有后代)都在默认命名空间http://www.aftmark.org中。

您看到的是命名空间 uri 和扩展的本地名称(又名 Clark 表示法)。

有关 ElementTree 中命名空间的更多信息,请参见此处

有关一般 XML 命名空间的更多信息,请参见此处

此外,请参阅此答案以获取另一种捕获未知名称空间以在 find/findall 中使用的方法。


推荐阅读