python - 拆分具有不同的txt文件使用 python 进行搜索
问题描述
我有一个[文本文件],我想使用 Python 将其拆分并转换为各种 XML 文件。我想搜索特定标签<seq
并从那里拆分文件。此外,为了将文件转换为结构化 XML,我必须将文本的值存储在这些标签内。
请注意,这<seq
不是文本文件中的封闭标记。
https://drive.google.com/file/d/1nv-G4Zp9Lmf3nqz9-9lCt-nUiO7CghQ8/view?usp=sharing
这是我到目前为止所尝试的:
with open("1.txt" , "r") as file:
with open ("2.txt", "w") as out:
page = file.read()
seq_exit = True
while seq_exit:
pos = page.find("<seq")
if pos == -1:
seq_exit = False
else:
pos1 = page.find("<seq")
pos2 = page.find("<seq", pos1+1)
matter = page[pos1:pos2]
out.write(matter)
page = page[pos2:]
解决方案
推荐阅读
- macos - 键盘快捷键在 macOS 的菜单栏应用程序中不起作用
- javascript - 当数据已经到达第一个响应时,消除发送 Xmlhttprequest 的开销
- azure - Azure:运行大量任务的最佳架构,每个任务需要 5 到 10 秒(从 web api 触发)?
- javascript - 如何验证数据 URL 方案图像
- r - 在 r lubridate 中将字符格式转换为日期格式,前导年 20 而不是 19
- html - wordpress 中的全宽视频拉伸问题
- ibm-watson - IBM Watson Personality Insights 使用什么机器学习算法?
- javascript - 尝试通过在我的终端上运行 web-ext run 来测试我的第一个 Firefox 扩展,但我的 HTML 没有呈现
- php - 如何跟踪 php-fpm 使用过多 CPU 的原因
- excel - golang将excel表格转换为结构