首页 > 解决方案 > 我如何将多个部分匹配字符串从行中拉出并在同一行上保持相同的顺序?

问题描述

我正在尝试从按列无序且每行单词数不均匀的基因合成日志文件中提取作物前缀,并将它们保持在相同的关联行上。

例如我的文件看起来像这样

Zm00001eb045170 GRMZM2G429533   Zm00021ab045500 Zm00016a004854  Zm00010a003862  Zm00011a003845  Zm00027ab045500
Zm00001eb286620 GRMZM2G007038   Zm00018ab300330 Zm00021ab291160 Zm00022ab291300 Zm00023ab295400 Zm00024ab292050
Zm00001eb039440 GRMZM2G023059   Zm00018ab041160 Zm00021ab039390 Zm00022ab039730

等等

我想提取以“Zm00001e”、“Zm00018a”和“Zm00039a”开头的单词,并保持它们在同一行上。我该怎么做?

我试过 grep

grep -oE "Zm00001e.*|Zm00018a.*|Zm00039a.*" filename > output.txt

我对编码非常缺乏经验,所以我不确定在这里做什么。感谢您提供任何帮助!

标签: filteringgit-bashgenome

解决方案


推荐阅读