python - lxml 在存在命名空间时搜索标签
问题描述
我对导航具有名称空间的 xml 文档有点困惑lxml.etree
。我已经看过一些关于这个主题的主题(1、2)以及lxml 文档,但仍然没有找到答案。
xml = """<?xml version='1.0' encoding='UTF-8' standalone='no'?>
<sbml xmlns="http://www.sbml.org/sbml/level2" level="2" metaid="metaid_0000001" version="1">
<model id="Teusink2000_Glycolysis" metaid="metaid_0000002" name="Teusink2000_Glycolysis">
<annotation>
</annotation>
</model>
</sbml>"""
from lxml import etree
utf8_parser = etree.XMLParser(encoding='utf-8')
xml = etree.fromstring(xml.encode('utf-8'), parser=utf8_parser)
搜索根元素似乎不起作用,但我想那是因为它是根元素,因此您实际上并不需要搜索它
print(xml.nsmap)
print(xml.findall('sbml'))
print(xml.findall('sbml', namespaces=xml.nsmap))
print(xml.findall('sbml', namespaces={'': 'http://www.sbml.org/sbml/level2'}))
生产
{None: 'http://www.sbml.org/sbml/level2'}
[]
[]
[]
model
但是,如果您给它一个命名空间,则搜索该元素确实有效
print(xml.findall('model'))
print(xml.findall('model', namespaces=xml.nsmap))
print(xml.findall('model', namespaces={'': 'http://www.sbml.org/sbml/level2'}))
生产
[]
[<Element {http://www.sbml.org/sbml/level2}model at 0x2125d7c0888>]
[<Element {http://www.sbml.org/sbml/level2}model at 0x2125d7c0448>]
但是,搜索annotation
元素并没有像我预期的那样工作。
print(xml.findall('annotation'))
print(xml.findall('annotation', namespaces=xml.nsmap))
print(xml.findall('annotation', namespaces={'': 'http://www.sbml.org/sbml/level2'}))
生产
[]
[]
[]
有人能指出我在这里缺少什么吗?
解决方案
你的语法是错误的。您只能使用 搜索当前级别annotation
。如果要搜索整棵树,则需要使用print(xml.findall('.//annotation', namespaces=xml.nsmap))
.
print(xml.findall('.//annotation', namespaces=xml.nsmap))
# [<Element {http://www.sbml.org/sbml/level2}annotation at 0x7fbcb9a14308>]