首页 > 解决方案 > xmlformatter 忽略引号中的小于

问题描述

我正在尝试格式化以下 xml

<block formula="MY_VAR < 3"><set-variable name="OTHER_VAR"></set-variable></block>

进入

<block formula="MY_VAR < 3">
  <set-variable name="OTHER_VAR">
  </set-variable>
</block>

由于我的公式中的 ,使用xmlformatter并出现错误。<具体的错误是

ExpatError:格式不正确(无效令牌)

当我尝试代码时

my_xml = '<block formula="MY_VAR < 3"><set-variable name="OTHER_VAR"></set-variable></block>'
formatter = xmlformatter.Formatter(indent="1", indent_char="  ", encoding_output="UTF-8", preserve=["literal"])
pretty_xml = formatter.format_string(my_xml)

如何在我的公式中包含小于并能够格式化我的 XML?

标签: pythonxmlpython-2.7xml-formatting

解决方案


您可以在构造 xml 字符串时使用xml.sax.saxutils.quoteattr来转义属性值。

>>> my_xml = '<block formula=%s><set-variable name="OTHER_VAR"></set-variable></block>' % su.quoteattr('MY_VAR < 3')
>>> my_xml
'<block formula="MY_VAR &lt; 3"><set-variable name="OTHER_VAR"></set-variable></block>'

如果您不控制 xml 的构造,则此 hack 将修复示例中的 xml:

stack = []

out = []
brackets = '<>'

for c in bad_xml:
    if c in brackets:
        try:
            prev = stack[-1]
        except IndexError:
            stack.append(c)
            out.append(c)
        else:
            if prev == c:
                escaped = '&gt;' if c == '>' else '&lt;'
                out.append(escaped)
            else:
                stack.append(c)
                out.append(c)
    else:
        out.append(c)
my_xml = ''.join(out)

推荐阅读