r - 从字符串集中创建并保存 fasta 文件
问题描述
我有这个 DNA 字符串集,但我想创建一个包含此信息的新 file.fa。什么是保存这些的有效方法?我尝试使用 write.fasta 但它崩溃了。
genes_seq <-
A DNAStringSet instance of length 254667
width seq names
[1] 2298 ATGGTGTCGTCTCCTTTCTATGTGAACAAGTTCA...AAAAAAATCAAAAACAAATCAAAAATCAAAAAA 22
[2] 2600 CTGACATAGATAAGTTTAGAGTTACCTCCCCTGT...GATACATACACATATATATCCATGTAAGATAGA 22
[3] 1351 ACACATTTATATATATTTATAAATATCAATAAAT...CGCATGTGTGTGTATGAGAGAGAGAGAGAGAGC 22
[4] 3668 TTGTTGATCAGCAGTAATGGTAAGGAAGTTAGTA...CACGAAATCATTGGGTTATTTTTTATACCAGTA 22
[5] 762 ATGACCATCTTTGGGGCAGAATCCACTTTTCATC...TCATTGGTCAGTTTTATTAAAGGCAGCATTTAA 22
... ... ...
[2544] 558 CTAGATCCTTCTCCTGCTGTTATCAAAAGTAGAC...ACTGATGTAATACTGCAATTAAACATGATAGCA 22
[2545] 1319 TTGAAAATGAATTATAGAAATGTCTTTTTCACGA...ACTTGCACTAAAACATTTAGCAATTTGGTTAGC 22
[2546] 1365 GTATTTTGTTTCAAATGTACAAGCTTGGACAACA...GACTGCATGCATTTACATTTATGTAAATACAAA 22
[2547] 1970 CAGAATACCAGAAACAGCGAAGAATTTTTCACAT...GAAATATATATGTGTGTGTATATATAAATAAAT 22
[2548] 260 TTTATTTTTATTCAAAAGACATGGACATTAAAGG...TCTACAGCTTTGCATTATGCTGTGACGGGGTAA OCBIM_22024624mg
>
解决方案
# Non reproducible example
library(ShortRead)
library(Biostrings)
head(fasta)
# A DNAStringSet instance of length 6
# width seq names
# [1] 1786 GGGGAGCCCGCAGAATTCGGAAAAAATCGTACGCTAAGGTTTTCCGGGCATCCGTAAGGGCCGAAACTTCCCGTCTTCCAGTCTGCG...GGTGCATCGGCCGGCACCTTGCGCAGGTTGTCGGCGTTCATCTCACGCAGGGTCTGCACGGCTGCCAGCACGCCTTGCGCGGCCGGC NODE_108_length_1...
# [2] 590 GGTCAGCCAGGATTTCACTTTCCAGCCGGTCGAGCATCTGCACCAGCACCGGCGGGAACACCACACTGCCACCGTCTTCGCCGCCGG...TGACGGTCATACCGGTAAAGATAGTGCGCGTCACGGGCGATACGGTTATCCGGCCACATGCTGAGGGTGCTGTCCGGGTGCAGCTCC NODE_145_length_5...
# [3] 2618 CTCTCCCGCACCTACAGCAGTTACCGGACAAAAACGCCCGCGCCGGTGGGGAGCCTCGGCCCCGGCTGGAAAATGCCTGCGGATATC...GGACAGCACCCTCAGCATGTGGCCGGATAACCGTATCGCCCGTGACGCGCACTATCTTTACCGGTATGACCGTCACGGCAGGCTGAC NODE_96_length_26...
# [4] 446 CTGCTGTGCTGTTTTGGTCCATCGGTGCCGCATACATGCCCGATACAGCCGCGGCACCCAGCCAGCCCACAGGGTTCCACCATGCCA...AAATCCCCGTAAAGGCAGATGCGTGCCATGCCCGGTGACGCCAGAGGGAGTGTGTGCGTCGCTGCCATTTGTCGGTGTACCTCTCTC NODE_192_length_4...
# [5] 235 CCCCTGCAGCGGGTCATAATAGCGGTGGCGGTTGTAATACAGGCCGGACTCCTCATCATACTGCTGCCCCGGCAGGCGGATAAGCTG...CACGCTGTTGCCCCTTCCGTGCTGATAAGCGCCAGCGGCAGGCCGCGATGGTCGCAGTGGTACAGGTGGATTTTTCGCGCCGGCGTG NODE_556_length_2...
# [6] 650 CCCTGCCAGGTGTACTGCAGTTGTGGCTCCAGCATCAGGTTGTCAGTGATACTGAAGGGCAGACCGGTTTCCAGTGAGCCCAGCCAG...ACGATAAGCATTTTCACTGCGCAGGTACCAGTCTTCATCGCTGTCACGGTTCAGGGTGTAGTTAAAGGCGCCGGCCTGAAGCGGGCG NODE_137_length_6...
fasta_dir <- file.path(getwd(), "refs")
outfile <- file.path(dirname(fasta_dir), "seq_fasta.fasta")
writeFasta(fasta, outfile, mode = "a")
推荐阅读
- r - R基于参考数据集创建虚拟数据集
- arrays - 如何在二维数组上使用 v-for
- c# - 是否有理由避免包含 System.Net.Http?
- outlook - 在 Outlook 的阅读窗格中直接显示投票结果
- java - 在 GCP 实例中下载或构建 maven 项目的方法是什么?
- laravel - Laravel Valet 站点上的端口 80 上的连接被拒绝
- eclipse - JDK 缺失,但已安装
- python - matplotlib 中是否有任何行为类似于 alpha 但相反?
- vb.net - 将具有 T 属性的类与 json 转换
- javascript - 在单击 d3 js 条形图上滚动条