首页 > 解决方案 > SeqIO.parse 在 genbank 文件中抛出错误

问题描述

我正在使用一些 genbank seq 文件并具有以下代码:

for seq_record in SeqIO.parse("datafile_location, "genbank"):

虽然它可以运行 seq 文件(包含多个 seq)中的大多数 seq,但我收到以下错误。关于如何解决这个问题的任何想法?

也许删除有问题的序列?它开始记录9212693145然后抛出错误。

我已经尝试重新下载 seq 文件,但这并不能解决问题。

文件“C:\python38\lib\site-packages\Bio\GenBank\Scanner.py”,第 516 行,在 parse_records 记录 = self.parse(handle, do_features) 文件“C:\python38\lib\site-packages\ Bio\GenBank\Scanner.py”,第 499 行,如果 self.feed(handle, consumer, do_features) 解析:文件“C:\python38\lib\site-packages\Bio\GenBank\Scanner.py”,第 466 行, 在 feed self._feed_header_lines(consumer, self.parse_header()) 文件“C:\python38\lib\site-packages\Bio\GenBank\Scanner.py”中,第 1801 行,在 feed_header_lines previous_value_line =structured_comment_dict[ KeyError: 'Assembly -数据'

标签: biopythonseqgenbank

解决方案


看起来与BioPython issue #2844类似。

最近合并了一个拉取请求来解决这个问题。


推荐阅读