python - 如何修复引号内的引号 XML
问题描述
所以我从我的 Plex 服务器中获得了这个 xml,我想用 python 处理它。我让一切正常,但是 Plex 服务器生成的 xml 表格式不正确。如果/当摘要包含包含在“”中的单词时,我的脚本将失败。
在 MediaContainer/Video summary="... "don't" ..." 中查看下面的代码
<MediaContainer>
<Video summary="Stupid text I "don't" care about...">
<Media id="Some id">
<Part id="Id I want"/>
</Media>
<Director tag="Name"/>
<Writer tag="Name"/>
</Video>
</MediaContainer>
我知道正确的方式,应该是这样的方式,就像..
<Video summary="Stupid text I "don't" care about...">
我根本不关心文本,所以如果有任何解决方法或者只是一个删除引号内所有引号的脚本,我会很好。
我现在意识到的另一件事是,如果这个词是 infact ,那么这个词中的单引号 ( ' ) 可能不会导致更多问题......
我更喜欢 Python 中的解决方案(如果可能,Python 3),但任何帮助将不胜感激。
解决方案
XML 要求您使用实体来编码某些字符,包括。引号:
<Video summary="Stupid text I "don't" care about...">
然后,您将拥有良好的格式。
推荐阅读
- android - 使用 Android 媒体播放器问题从 url 播放音频
- reactjs - 如何从当前路由中删除查询参数?
- node.js - jhipster/spring boot - 尝试代理请求时发生错误
- android - 在 Kindle 上使用 AppAuth 登录 Google
- vba - 如何在 VBA 中实现工厂项目模式?
- vba - 调试访问 VBA Currentdb.Execute
- time-series - 在模型平均预测中组合多个预测区间
- regex - REGEX 在引号之间但在指定字符串之后提取字符串
- javascript - 解析错误:保留关键字'yield'
- php - 初学者:cakephp 3.6 安装 cakedc/users