首页 > 解决方案 > 创建循环并将输出保存在 .txt 或 .fasta 文件中

问题描述

我有一个 7754 obs 的数据集。和 5 个变量

name    protein     mutation_CDS    mutation_nonCDS     seq
B*07    02                01               01           ATGCTGGTCATGGCGCCCCGAACCGTCCTCCTGCTGCTCTCGG
B*07    02                01               48           ATGCTGGTCATGGCGCCCCGAACCGTCCTCCTGCTGCTCTCGG
...
B*18    153               NA               NA           ATGCGGGTCACGGCGCCCCGAACCCTCCTCCTGCTGCTCTGGG
B*18    155               NA               NA           ATGCGGGTCACGGCGCCCCGAACCCTCCTCCTGCTGCTCTGGG
...

在“名称”变量中,我有 36 个不同的名称,不同的行数具有此名称“B 07”“B 08”“B 13”“B 14”“B 15”“B 18”“B 27”“B 35 ""B 37""B 38""B 39""B 40""B 41""B 42""B 44""B 45""B 46""B 47""B 48""B 49"" B 50" "B 51" "B 52" "B 53" "B 54" "B 55" "B 56” “B 57” “B 58” “B 59” “B 67” “B 73” “B 78” “B 81” “B 82” “B 83”

我的想法是,在 R 中创建一个循环,在其中我使用其 7754 obs 获取整个数据集,查找唯一名称(“B * 07”)并存储具有该名称的所有行(包括列)并存储它在带有标签“B07”的新数据集中,或者直接创建一个 .txt(或 .fasta)文件。

我最终会得到单独的文件,例如一个名为 B07 的文件,其中只包含 B*07 信息(620 ob​​s。和 5 个变量)

name    protein     mutation_CDS    mutation_nonCDS     seq
B*07    02                01              01            ATGCTGGTCATGGCGCCCCGAACCGTCCTCCTGCTGCTCTCGG
B*07    02                01              48            ATGCTGGTCATGGCGCCCCGAACCGTCCTCCTGCTGCTCTCGG

和一个名为 B08 的文件,仅包含 B*08 信息(X obs.和 5 个变量)

B*18    153     NA      NA          ATGCGGGTCACGGCGCCCCGAACCCTCCTCCTGCTGCTCTGGG
B*18    155     NA      NA          ATGCGGGTCACGGCGCCCCGAACCCTCCTCCTGCTGCTCTGGG

简而言之,我想将 7754 个观察结果拆分为参考某个名称模式的部分

"B*07" 620 of 7754

"B*08" X of 7754

"B*13" X of 7754

等等

有没有人有一个想法如何做到这一点?

标签: loopsdesign-patternssavesequence

解决方案


推荐阅读