bash - 如何从文本中提取特定字符串
问题描述
我有一个这样的 .txt 文件,
26S proteasome non-ATPase regulatory subunit 1 OS=Homo sapiens OX=9606 GN=PSMD1 PE=1 SV=1
Tensin-1 OS=Homo sapiens OX=9606 GN=TNS1 PE=1 SV=1
Integrin-linked protein kinase OS=Homo sapiens OX=9606 GN=ILK PE=1 SV=1
Glucose-6-phosphate isomerase (Fragment) OS=Homo sapiens OX=9606 GN=GPI PE=1 SV=1
Fibulin-5 OS=Homo sapiens OX=9606 GN=FBLN5 PE=1 SV=1
Tropomyosin alpha-1 chain (Fragment) OS=Homo sapiens OX=9606 GN=TPM1 PE=1 SV=1
Cadherin-1 OS=Homo sapiens OX=9606 GN=CDH1 PE=1 SV=1
我只想在之后提取字符串GN=
我想要这样的输出
PSMD1
TNS1
ILK
GPI
FBLN5
TPM1
CDH1
解决方案
这可能对您有用:
$ grep -Po 'GN=\K[^[:space:]]+' file
PSMD1
TNS1
ILK
GPI
FBLN5
TPM1
CDH1
推荐阅读
- c++ - 安装MinGW后C++编译器不工作?
- docker - 只有 NodePort 服务上的 nodePort 为 80 时才能访问 Google Compute kubernetes
- python - 从在线资源中读取特定单词 - Python
- javascript - pdf.js 升级到 1.9.426 版本后找不到 pdf.worker.js
- android - 重复通知设置安静时间
- python - 查找句子的谓词:
- excel - 在 VBA Excel 中按项 ChildNodes(0) 的数量获取子节点时的自动化错误
- angular - 如何为 Angular 5 中的每个社交分享设置元标记?
- sql - 具有两个 WHERE 条件的 SQL 查询
- c# - System.Security.SecurityException:“不允许请求的注册表访问。”