首页 > 解决方案 > 时髦的 XML 标签解析

问题描述

我正在尝试解析开放式办公室 XML。我在 Python 中使用 lxml 进行了很好的解析,但我需要获取的数据位于一个标签内,该标签的结构对我来说有点时髦。

<w:sdt Content> Dataaaaa </w:sdt>

通常这会很好,因为有很多 sdt 标签。但是“内容”部分让我失望。这段代码:

for element in tree.iter('{http://schemas.openxmlformats.org/wordprocessingml/2006/main}sdt'):
    print(element.tag, element.attrib)

返回以下多个标签,所以我不知道哪个是哪个:

{http://schemas.openxmlformats.org/wordprocessingml/2006/main}sdt {}

另外,不要担心命名空间,因为我已经弄清楚了。我只是想访问上面的标签和里面的数据。:)

标签: pythonxmllxmlopenxml

解决方案


推荐阅读