首页 > 解决方案 > 如何使用python解析带有xmlns属性的xml

问题描述

<?xml version="1.0" ?>

<school xmlns="loyo:22:2.2">
    <profile>
        <student xmlns="loyo:5:542">
            <marks>
                <mark java="java:/lo">
                    <ca1>200</ca1>
                </mark>
            </marks>
        </student>
    </profile>
</school>

我试图访问ca1文本。我正在使用 etree 但我无法访问它。我正在使用下面的代码。

import xml.etree.ElementTree as ET
tree = ET.parse('mca.xml')
root = tree.getroot()

def getElementsData(xpath):
    elements = list()
    if root.findall(xpath):
        for elem in root.findall(xpath):
            elements.append(elem.text)
        return elements
    else:
        raise SystemExit("Invalid xpath provided")



t = getElementsData('.//ca1')
for i in t:
    print(i)

我尝试以不同的方式访问它我不知道确切的问题。是录制文件类型问题吗?

标签: pythonxpathelementtree

解决方案


您的文档在节点schoolstudent上有命名空间,您需要在搜索中合并命名空间。由于您正在寻找ca1,它位于student下,因此您需要指定student节点具有的命名空间:

import xml.etree.ElementTree as ET
tree = ET.parse('mca.xml')
root = tree.getroot()

def getElementsData(xpath, namespaces):
    elements = root.findall(xpath, namespaces)
    if elements == []:
        raise SystemExit("Invalid xpath provided")
    return elements


namespaces = {'ns_school': 'loyo:22:2.2', 'ns_student': 'loyo:5:542'}
elements = getElementsData('.//ns_student:ca1', namespaces)

for element in elements:
    print(element)

笔记

  • 由于您的命名空间没有名称,因此我给它们起了ns_schoolns_student之类的名称,但这些名称可以是任何名称(例如ns1mystudent ......)
  • 在更复杂的系统中,我建议引发一些其他类型的错误,让调用者决定是否退出。

推荐阅读