python - Python :: 如何按标签拆分xml字符串?
问题描述
我有一个带有以下文本的字符串(在一个名为 token.txt 的文件中)。
<nexttoken>test1</nexttoken>
<nexttoken>test2</nexttoken>
我想删除标签<nexttoken>
,我想显示第二行,即test2
输出 = test2
我尝试了什么:
with open("token.txt") as f:
for line in f:
if "nexttoken" in line:
lines_contain_next_token = line
n2=lines_contain_next_token.replace("</nexttoken>","\n")
n3=n2.replace("<nexttoken>","\n")
n4=n3.replace("\n",",")
n5=n4.replace(' ','')
print n5
解决方案
如果您的文本中只有两个nexttoken
标签,那么您可以使用正则表达式来提取所需的值。
前任:
import re
with open(filename, "r") as infile:
data = infile.read()
c = re.findall("\<nexttoken\>(.*)\<\/nexttoken\>", data)
print(c[1])
输出:
test2
注意:如果您的 src 文件是 XML 文件,我强烈建议您使用 python xml 解析器。
推荐阅读
- single-sign-on - 通过 HTTP 重定向绑定到 ADFS 的 SAML 注销请求以请求者的身份获得响应而不是成功 - 从浏览器发起的请求
- firebase - 我正在尝试使用flutter和firebase制作一个杂货应用程序,一切正常,但是当我按下复选框时,它会检查所有这些
- sql - 从 BigQuery 到数据洞察的日期格式
- laravel - 如何在 Laravel 8 中将订单发票号黑色传递给查看
- xamarin - 如何在 Xamarin 中调整和压缩图像文件的大小
- javascript - 使用动态图像实现自动完成
- java - JavaFX KeyEvent.consume() 无法停止事件传播
- javascript - 从 Web 扩展的后台脚本中访问 about:addons 的内容
- python - 正方体 OCR 参数
- node.js - 获取 bcrypt 所需的错误数据和盐参数?