python - 在 Python 中读取 XML 块
问题描述
我有一个如下所示的 XML 文件,其中包含多个 xml。我想获取<Sacd>
内容。
<?xml version="1.0" encoding="utf-8"?>
<Sacd>
<Acdpktg> <Acdpktg/>
</Sacd>
<?xml version="1.0" encoding="utf-8"?>
<Sacd>
<Acdpktg/>
</Sacd>
<?xml version="1.0" encoding="utf-8"?>
<Sacd>
<AcdpktG>
<Result Value="0"/>
<Packet Value="Dnd"/>
<Invoke Value="abc"/>
</AcdpktG>
</Sacd>
如何提取 Sacd 标签内的值?
解决方案
好吧,您的 xml 在几个方面存在问题。首先,它在 in 中包含多个 xml 文件——这不是一个好主意;它们必须拆分为单独的 xml 文件。二、第一个<Acdpktg> <Acdpktg/>
标签对无效;它应该是<Acdpktg> </Acdpktg>
。
但是一旦这一切都解决了,您就可以获得预期的输出。所以:
from lxml import etree
big = """[your xml above,fixed]"""
smalls = big.replace('<?xml','xxx<?xml').split('xxx')[1:] #split it into small xml files
for small in smalls:
xml = bytes(bytearray(small, encoding='utf-8')) #either this, or remove the xml declarations from each small file
doc = etree.XML(xml)
for value in doc.xpath('.//AcdpktG//*/@Value'):
print(value)
输出:
0
Dnd
abc
for
或者,通过稍微改变内部循环可以获得更高级的输出:
for value in doc.xpath('.//AcdpktG//*'):
print(value.tag, value.xpath('./@Value')[0])
输出:
Result 0
Packet Dnd
Invoke abc