首页 > 解决方案 > lxml 在存在命名空间时搜索标签

问题描述

我对导航具有名称空间的 xml 文档有点困惑lxml.etree。我已经看过一些关于这个主题的主题(12)以及lxml 文档,但仍然没有找到答案。

xml = """<?xml version='1.0' encoding='UTF-8' standalone='no'?>
<sbml xmlns="http://www.sbml.org/sbml/level2" level="2" metaid="metaid_0000001" version="1">
    <model id="Teusink2000_Glycolysis" metaid="metaid_0000002" name="Teusink2000_Glycolysis">
        <annotation>
        </annotation>
    </model>
</sbml>"""
from lxml import etree
utf8_parser = etree.XMLParser(encoding='utf-8')
xml = etree.fromstring(xml.encode('utf-8'), parser=utf8_parser)

搜索根元素似乎不起作用,但我想那是因为它是根元素,因此您实际上并不需要搜索它

print(xml.nsmap)
print(xml.findall('sbml'))
print(xml.findall('sbml', namespaces=xml.nsmap))
print(xml.findall('sbml', namespaces={'': 'http://www.sbml.org/sbml/level2'}))

生产

{None: 'http://www.sbml.org/sbml/level2'}
[]
[]
[]

model但是,如果您给它一个命名空间,则搜索该元素确实有效

print(xml.findall('model'))
print(xml.findall('model', namespaces=xml.nsmap))
print(xml.findall('model', namespaces={'': 'http://www.sbml.org/sbml/level2'}))

生产

[]
[<Element {http://www.sbml.org/sbml/level2}model at 0x2125d7c0888>]
[<Element {http://www.sbml.org/sbml/level2}model at 0x2125d7c0448>]

但是,搜索annotation元素并没有像我预期的那样工作。

print(xml.findall('annotation'))
print(xml.findall('annotation', namespaces=xml.nsmap))
print(xml.findall('annotation', namespaces={'': 'http://www.sbml.org/sbml/level2'}))

生产

[]
[]
[]

有人能指出我在这里缺少什么吗?

标签: pythonnamespaceslxml

解决方案


你的语法是错误的。您只能使用 搜索当前级别annotation。如果要搜索整棵树,则需要使用print(xml.findall('.//annotation', namespaces=xml.nsmap)).

print(xml.findall('.//annotation', namespaces=xml.nsmap))
# [<Element {http://www.sbml.org/sbml/level2}annotation at 0x7fbcb9a14308>]

推荐阅读