首页 > 解决方案 > 使用 Python 从 XML 中提取数据

问题描述

我正在努力从 XML 中提取特定数据。不幸的是,我根本没有编程经验。整整一周,我试图自己解决它,但没有取得多大成功。

我的 XML 文件是自然语言处理软件的输出。

它具有以下结构:它给出了识别的信心,单词的口头表达的结束时间,语音转录,开始时间和之后的单词。我想提取某些单词的开始/结束时间。例如 end="3249555" start="3249105" Verfahren(处理后的文本是德语)。

我知道 ElemetTree 是一个读取 XML 文件的包。我已经尝试了以下代码但没有成功

在此处输入图像描述

以及 XML 文件的摘录

在此处输入图像描述

我真的很感激任何帮助。

标签: pythonxml

解决方案


利用:

root.findAll('//*[text()="Verfahren"])

然后找到获取属性的方法


推荐阅读