loops - 创建循环并将输出保存在 .txt 或 .fasta 文件中
问题描述
我有一个 7754 obs 的数据集。和 5 个变量
name protein mutation_CDS mutation_nonCDS seq
B*07 02 01 01 ATGCTGGTCATGGCGCCCCGAACCGTCCTCCTGCTGCTCTCGG
B*07 02 01 48 ATGCTGGTCATGGCGCCCCGAACCGTCCTCCTGCTGCTCTCGG
...
B*18 153 NA NA ATGCGGGTCACGGCGCCCCGAACCCTCCTCCTGCTGCTCTGGG
B*18 155 NA NA ATGCGGGTCACGGCGCCCCGAACCCTCCTCCTGCTGCTCTGGG
...
在“名称”变量中,我有 36 个不同的名称,不同的行数具有此名称“B 07”“B 08”“B 13”“B 14”“B 15”“B 18”“B 27”“B 35 ""B 37""B 38""B 39""B 40""B 41""B 42""B 44""B 45""B 46""B 47""B 48""B 49"" B 50" "B 51" "B 52" "B 53" "B 54" "B 55" "B 56” “B 57” “B 58” “B 59” “B 67” “B 73” “B 78” “B 81” “B 82” “B 83”
我的想法是,在 R 中创建一个循环,在其中我使用其 7754 obs 获取整个数据集,查找唯一名称(“B * 07”)并存储具有该名称的所有行(包括列)并存储它在带有标签“B07”的新数据集中,或者直接创建一个 .txt(或 .fasta)文件。
我最终会得到单独的文件,例如一个名为 B07 的文件,其中只包含 B*07 信息(620 obs。和 5 个变量)
name protein mutation_CDS mutation_nonCDS seq
B*07 02 01 01 ATGCTGGTCATGGCGCCCCGAACCGTCCTCCTGCTGCTCTCGG
B*07 02 01 48 ATGCTGGTCATGGCGCCCCGAACCGTCCTCCTGCTGCTCTCGG
和一个名为 B08 的文件,仅包含 B*08 信息(X obs.和 5 个变量)
B*18 153 NA NA ATGCGGGTCACGGCGCCCCGAACCCTCCTCCTGCTGCTCTGGG
B*18 155 NA NA ATGCGGGTCACGGCGCCCCGAACCCTCCTCCTGCTGCTCTGGG
简而言之,我想将 7754 个观察结果拆分为参考某个名称模式的部分
"B*07" 620 of 7754
"B*08" X of 7754
"B*13" X of 7754
等等
有没有人有一个想法如何做到这一点?
解决方案
推荐阅读
- node.js - req.params.id 未定义,ReferencesError : id 未定义
- sql - 如何查看值子集中的每个值至少出现一次?
- javascript - 如何根据一个等值的性质得到数组中各种对象的正负值之和?
- python - 具有大可迭代的多处理
- aws-lambda - 来自 Lambda 函数的 AssumeRole 间歇性成功
- debugging - gdb 不透明符号解析已关闭
- java - 按键对对象进行分组并创建树
- javascript - 如何使用 Dynamoose 正确查询索引
- spring-boot - Spring Webflux 上传大图像文件并使用 WebClient 以流的方式发送文件
- r - BiodiversityR::rankabundance() 函数不计算 plower 和 pupper 值