linux - 如何从多个文件中提取特定信息并在linux中制作表格?
问题描述
我有多个包含信息的文本文件。在这里,我展示了两个文本文件,如下所示:
样本1.txt
Status /documents/Sample1.sorted.bam
Assigned 50945040
Unassigned_Unmapped 947866
Unassigned_MappingQuality 0
Unassigned_Chimera 0
Unassigned_FragmentLength 0
Unassigned_Duplicate 0
Unassigned_MultiMapping 49013681
Unassigned_Secondary 0
Unassigned_Nonjunction 0
Unassigned_NoFeatures 21189312
Unassigned_Overlapping_Length 0
Unassigned_Ambiguity 4430011
样本2.txt
Status /documents/Sample2.sorted.bam
Assigned 36335614
Unassigned_Unmapped 870456
Unassigned_MappingQuality 0
Unassigned_Chimera 0
Unassigned_FragmentLength 0
Unassigned_Duplicate 0
Unassigned_MultiMapping 68688141
Unassigned_Secondary 0
Unassigned_Nonjunction 0
Unassigned_NoFeatures 23746485
Unassigned_Overlapping_Length 0
Unassigned_Ambiguity 3734593
对于单个文本文件,我使用 grep:
grep "Assigned\|Unmapped\|MultiMapping\|NoFeatures\|Ambiguity" Sample1.txt > output.txt
但我希望输出如下所示,我可以在所有文本文件上使用一个小脚本并制作表格:
Sample1 Sample2
Assigned 50945040 36335614
Unassigned_Unmapped 947866 870456
Unassigned_MultiMapping 49013681 68688141
Unassigned_NoFeatures 21189312 23746485
Unassigned_Ambiguity 4430011 3734593
解决方案
$ cat tst.awk
$2 != 0 {
printf "%s%s", (NR>1 ? $1 : "Name"), OFS
for (i=2; i<=NF; i+=2) {
gsub(/^.*\/|\..*$/,"",$i)
printf "%s%s", $i, (i<NF ? OFS : ORS)
}
}
$ paste Sample1.txt Sample2.txt | awk -f tst.awk | column -t
Name Sample1 Sample2
Assigned 50945040 36335614
Unassigned_Unmapped 947866 870456
Unassigned_MultiMapping 49013681 68688141
Unassigned_NoFeatures 21189312 23746485
Unassigned_Ambiguity 4430011 3734593
要获得 Excel 可以理解的输出而不是问题中显示的输出,请执行以下操作:
$ cat tst.awk
BEGIN { OFS="," }
$2 != 0 {
printf "%s%s", (NR>1 ? $1 : "Name"), OFS
for (i=2; i<=NF; i+=2) {
gsub(/^.*\/|\..*$/,"",$i)
printf "%s%s", $i, (i<NF ? OFS : ORS)
}
}
$ paste Sample1.txt Sample2.txt | awk -f tst.awk > output.csv
然后双击 output.csv 以使用 Excel 打开它。
推荐阅读
- logging - 如何将 kubernetes 中所有 pod 的日志存储在 Node 上的一处?
- python - Pynput 显示错误的鼠标位置数据
- sql - SQL server 的数据库是 sql 数据库吗?
- android - android库项目中第三方库的aar文件大小减少到0
- html - 限制视频下载的最大大小
- javascript - 如何在 JavaScript 中使用本地存储?
- reactjs - 如何在 React js 中使用动态路由在选项卡或导航菜单之间切换?
- android - 如何使用 FFMPEG 从 url 录制/下载 m3u steam 视频
- javascript - 当我们从移动相机上传时,angular6中的图像旋转问题
- reactjs - 无法在 aws s3 中加载带有 url 段的 ReactJS