首页 > 解决方案 > stringtie 指南参考注释错误

问题描述

使用 bowtie2-build 我创建了拟南芥 Araport11 基因组的索引文件(https://www.arabidopsis.org/download/index-auto.jsp?dir=%2Fdownload_files%2FGenes%2FAraport11_genome_release),其中我使用了 Araport11_cdna_20160703_representative_gene_model.gz对于转录组。然后,我使用 bowtie2 创建了单端读取的 .bam 文件,并使用 samtools 排序将它们转换为 .bam。我现在想做的是创建一个读取计数 csv 文件,以及带有 stringtie 的 gtf 文件。为此,我获得了这些注释指南文件:Araport11_GFF3_genes_transposons.201606.gff.gz & Araport11_GFF3_genes_transposons.201606.gtf.gz。我对这些文件应用了 gunzip。

但是,当我尝试运行 stringtie {input} -eB -G {either of the .gff or .gtf guides} -o {output}

对于 .gff- 和 .gtf 指南文件,我收到以下警告:警告:没有为读取映射的基因组序列找到参考转录本!请确保 -G 注释文件对基因组序列使用相同的命名约定。

然后在运行 prepDE.py 时,它包含适当的拟南芥 AGI 作为行,以及适当的样本特定列(代表每个样本的读数)。但是,文件中的所有值都为零!

显然,一定是出了什么问题。此外,当手动搜索 .gff 和 .gtf 文件中我的 .bam 文件中列出的基因时,实际上有结果!所以看起来相同的命名约定是正确的。我在这里做错了什么?

标签: unixbowtie

解决方案


推荐阅读