首页 > 解决方案 > 如何仅收集一行的所有序列导致 fasta 文件

问题描述

我试图在一个快速文件中找到所有染色体,并将 DNA 制成 rna,然后获得第一个 ORF,以便最终将其转移到蛋白质中。这是我的代码:

from Bio.Seq import Seq
from Bio import SeqIO
import re
s=''
for record in SeqIO.parse("Rosomary-r6.17.fasta","fasta"):
    if not re.match('^>',record):
        s=s+record
        dna=Seq(s)
        rna=dna.transcribe()
        get=re.search('AUG([AUGC]{3})+?(UAA|UAG|UGA)',str(rna))
        orf=get.group()
        orf1=Seq(orf)
        protein=orf.translate()
        print(protein)

但是,我不断收到此错误:

   MGDTDSGDI*
   MGDTDSGDI*
   MGDTDSGDI*
   MGDTDSGDI*
...

在这种情况下我应该怎么做才能解决这个问题?我只需要一行结果。谢谢!

标签: pythonbioinformaticsbiopythonfasta

解决方案


推荐阅读