首页 > 解决方案 > 拆分具有不同的txt文件使用 python 进行搜索

问题描述

我有一个[文本文件],我想使用 Python 将其拆分并转换为各种 XML 文件。我想搜索特定标签<seq并从那里拆分文件。此外,为了将文件转换为结构化 XML,我必须将文本的值存储在这些标签内。

请注意,这<seq不是文本文件中的封闭标记。

https://drive.google.com/file/d/1nv-G4Zp9Lmf3nqz9-9lCt-nUiO7CghQ8/view?usp=sharing

这是我到目前为止所尝试的:

with open("1.txt" , "r") as file:
with open ("2.txt", "w") as out:
 page = file.read()
 seq_exit = True

 while seq_exit:
     pos = page.find("<seq")
     if pos == -1:
         seq_exit = False
     else:
         pos1 = page.find("<seq")
         pos2 = page.find("<seq", pos1+1)
         matter = page[pos1:pos2]
         out.write(matter)
         page = page[pos2:]

标签: pythonxmltxt

解决方案


推荐阅读