首页 > 解决方案 > 比对序列并将其与引物进行比较

问题描述

我希望展示引物在一些基因组数据中的一致性。我有一个大约 23bp 的引物,并希望将其与大约 5000 个 10kb 的基因组序列进行比较。由于这对我的计算机来说太多了,所以我想这样做:

>     1. Cut out the area that my primer is located and about 20bp down each end. 
>     2. Show only the bases that are different from my primer in my analysis.
>      ex: Primer: -----------ATGTGGAAGCAAATATCAAATGA---------
>          Gene:   ATGACCATACG----C--------------T---ATCGTAGGG
>                  ATGAGCATACC-----A----T--------T---TTCGAACGC

我使用的数据是所有登革热序列(所有血清型)和带有以下代码的引物:ATGTGGAAGCAAATATCAAATGA。

我试图以某种方式使用 msa() 函数,只查看感兴趣的基因部分。但是,这很困难,因为要准确预测是否需要对齐。

我仍在考虑可能在基因的那部分周围剪下一个任意数字并对齐它,但无法找到正确展示它的方法,并且还认为其他人可能会提出更好的方法来做这件事。

我正在使用 Biostrings、msa 和 seqinr。我使用ncbi获取基因序列并使用 FASTA 文件。

谢谢!

标签: rbioinformaticsbioconductorsequence-alignment

解决方案


推荐阅读