r - 如何拆分通过“>”导入为 data.frame 的 FASTA 文件
问题描述
我喜欢将 R 中的 FASTA 文件导入到如下所示的单列数据框中:
dna.sequences <- data.frame(c(">ID1", "sequence1", ">ID2" , "sequence2", ...))
我想将此数据框分成两列,并消除每个 ID 之前的“>”,所以我终于得到了这样的东西
new_dna <- data.frame(
ID = c("ID1", "ID2" ... ),
sequence = c("sequence1", "sequence2" ... )
)
在此先感谢,何塞
解决方案
如果您总是有备用值ID
和sequence
值,则可以使用矢量回收技术。
transform(data.frame(ID = dna.sequences$col[c(TRUE, FALSE)],
sequence = dna.sequences$col[c(FALSE, TRUE)]),
ID = sub('^>', '', ID))
# ID sequence
#1 ID1 sequence1
#2 ID2 sequence2
数据
dna.sequences <- data.frame(col = c(">ID1", "sequence1", ">ID2" , "sequence2"))
推荐阅读
- java - RxJava 2 Observable.intervalRange 的基础架构是什么?
- c++ - Aspose.PDF 触发断点
- wordpress - 更改 WooCommerce 产品商店 URL
- angular - 未捕获的 DOMException:无法在“窗口”上执行“postMessage”
- react-native - 错误:由于 React native (Realm) 中出现以下错误,需要迁移
- ruby-on-rails - 从 c9.io 迁移到 AWS Cloud9 后如何修复 rake db:migrate 错误?
- python - pygame:调整子类所基于的表面大小
- .net-core - 如何解决 HTTP 405 错误 NotAllowedMethod
- php - 如何调试 LARAVEL 419 POST 错误?
- powershell - 如何使用参数列表将参数添加到作业中