首页 > 解决方案 > Python - 提取文本

问题描述

我有一个包含一些文本的文件,我需要从该文件中提取两个值并分配给变量。

第一部分如下所示:

<DOCUMENT>
<TYPE>4
<SEQUENCE>1
<FILENAME>form.xml
<DESCRIPTION>PRIMARY DOCUMENT

基本上我需要提取“form.xml”并将其分配给某个变量。

接下来是这样的:

<rptOwnerId>0001720314</rptOwnerId>

在这种情况下,我需要获取标签之间的值并将其分配给一个变量。

但我很难找到最好的方法来做到这一点。

谢谢大家!

标签: pythontextextract

解决方案


试试这个代码

from xml.etree import ElementTree as ET
xml = "<rptOwnerId>0001720314</rptOwnerId>".strip()
value = ET.fromstring(xml).find("rptOwnerId")
if value:
    print(value.text)

希望这可以帮助。我还建议您查看这篇文章以从头开始理解 XML解析


推荐阅读