首页 > 解决方案 > 如何修复引号内的引号 XML

问题描述

所以我从我的 Plex 服务器中获得了这个 xml,我想用 python 处理它。我让一切正常,但是 Plex 服务器生成的 xml 表格式不正确。如果/当摘要包含包含在“”中的单词时,我的脚本将失败。

在 MediaContainer/Video summary="... "don't" ..." 中查看下面的代码

<MediaContainer>
  <Video summary="Stupid text I "don't" care about...">
      <Media id="Some id">
        <Part id="Id I want"/>
      </Media>
      <Director tag="Name"/>
      <Writer tag="Name"/>
  </Video>
</MediaContainer>

我知道正确的方式,应该是这样的方式,就像..

<Video summary="Stupid text I &quot;don't&quot; care about...">

我根本不关心文本,所以如果有任何解决方法或者只是一个删除引号内所有引号的脚本,我会很好。

我现在意识到的另一件事是,如果这个词是 infact ,那么这个词中的单引号 ( ' ) 可能不会导致更多问题......

我更喜欢 Python 中的解决方案(如果可能,Python 3),但任何帮助将不胜感激。

标签: pythonxml

解决方案


XML 要求您使用实体来编码某些字符,包括。引号:

<Video summary="Stupid text I &quot;don't&quot; care about...">

然后,您将拥有良好的格式。


推荐阅读