biopython - SearchIO.parse xml 爆炸和 & 符号 cElementTree.ParseError: not well-formed (invalid token) 错误
问题描述
我想要一些建议来解决 xml 解析错误。在我的 BLAST xml 输出中,我有一个包含“&”字符的描述,该字符会抛出 SearchIO.parse 函数。
如果我跑
qresults=SearchIO.parse(PLAST_output,"blast-xml")
for record in qresults:
#do some stuff
我收到以下错误:
cElementTree.ParseError: not well-formed (invalid token): line 13701986, column 30
这将我引向这一行:
<Hit_def>Lysosomal & prostatic acid phosphatases [Xanthophyllomyces dendrorhous</Hit_def>
有没有办法在 biopython 中覆盖它,所以我不必更改我的 xml 文件?现在,我只是在做一个“尝试/排除”循环,但这不是最佳的!
谢谢你的帮助!考特尼
解决方案
推荐阅读
- javascript - 未捕获的 ReferenceError:未为 Web 定义 firebase
- html - CSS - 线性渐变背景上的悬停效果
- python - 使用 selenium 使用 css 选择器查找后如何获取项目 url
- windows - 服务器 SSL 认证路径与浏览器认证路径不同
- ssl - wcf 窗口服务。创建 TLS 客户端凭据时发生致命错误。内部错误状态为 10013
- hmacsha1 - OAuth1.0a C 库或 HMAC-SHA1 C 库
- git - 标签的 Jenkins Git 参考存储库路径
- visual-studio-code - vscode 自定义任务问题匹配器找不到匹配正则表达式的文本
- ios - 什么会导致 RevenueCat 在 App Review 期间失败?
- r - 删除 R 中按因子分组的异常值