awk - 将序列连接到fasta文件中的ID
问题描述
这是我的输入文件
>OTU1;size=4;
ATTCCGGGTTTACT
ATTCCTTTTATCGA
ATC
>OTU2;size=10;
CGGATCTAGGCGAT
ACT
>OTU3;size=5;
ATTCCCGGGATCTA
ACTTTTC
预期的输出文件是:
>OTU1;size=4;ATTCCGGGTTTACTATTCCTTTTATCGAATC
>OTU2;size=10;CGGATCTAGGCGATACT
>OTU3;size=5;ATTCCCGGGATCTAACTTTTC
我已经尝试过删除 FASTA 文件中的换行符中的代码
但这对我不起作用,我不确定如何修改该帖子中的代码......有什么建议吗?提前致谢!
解决方案
$ awk '{printf "%s%s", (/^>/ ? ors : ""), $0; ors=ORS} END{print ""}' file
>OTU1;size=4;ATTCCGGGTTTACTATTCCTTTTATCGAATC
>OTU2;size=10;CGGATCTAGGCGATACT
>OTU3;size=5;ATTCCCGGGATCTAACTTTTC
推荐阅读
- c - 为什么我会在非结构或联合的情况下收到“对成员 '******' 的请求”?
- python - 当我为 Django Rest Framework API 测试我的 POST 路由时,即使已登录,它也会返回未经过身份验证的 401
- python - tf.losses.log_loss 用于乘法类
- html - 增加 div 高度以适应里面的内容
- sql - Sql - 非布尔表达式错误
- mysql - (1193,“未知系统变量'explicit_defaults_for_timestamp'”)[SQL:'SELECT @@explicit_defaults_for_timestamp']
- javascript - 如何在html表格中显示一个json数组
- java - Java 发送带有客户端身份验证的 HTTP Post
- excel - 无法将 Selenium 与公司修改的浏览器一起使用
- java - 尝试...catch 循环未捕获异常