首页 > 解决方案 > SearchIO.parse xml 爆炸和 & 符号 cElementTree.ParseError: not well-formed (invalid token) 错误

问题描述

我想要一些建议来解决 xml 解析错误。在我的 BLAST xml 输出中,我有一个包含“&”字符的描述,该字符会抛出 SearchIO.parse 函数。

如果我跑

qresults=SearchIO.parse(PLAST_output,"blast-xml")

for record in qresults:
    #do some stuff

我收到以下错误:

cElementTree.ParseError: not well-formed (invalid token): line 13701986, column 30

这将我引向这一行:

<Hit_def>Lysosomal & prostatic acid phosphatases [Xanthophyllomyces dendrorhous</Hit_def>

有没有办法在 biopython 中覆盖它,所以我不必更改我的 xml 文件?现在,我只是在做一个“尝试/排除”循环,但这不是最佳的!

谢谢你的帮助!考特尼

标签: biopython

解决方案


推荐阅读