首页 > 解决方案 > 如何使用正则表达式提取文本后跟一些模式?

问题描述

我有一些如下文字:

从这些文本中我只需要提取

我不喜欢与regex. 我尝试了以下模式,但我有点迷路了

[A-Z] [0-9A-Z]{4}

任何人都可以帮我解决这个问题。

标签: regex

解决方案


您可以使用

\b[0-9A-Z]{4}\s+(.+)

请参阅正则表达式演示。捕获组 1 将保留您需要的值。

细节

  • \b- 单词边界
  • [0-9A-Z]{4} - 四个字符,大写字母或数字
  • \s+- 1+ 空格
  • (.+)- 第 1 组:任何一个或多个字符,除了换行符,尽可能多。

作为对评论的回答,您可以考虑

^(?:\S+\s+){4}(.+)

查看另一个正则表达式演示。它匹配

  • ^- 字符串的开始
  • (?:\S+\s+){4}- 四次出现 1+ 非空白字符,后跟 1+ 空白字符
  • (.+)- 第 1 组:任何一个或多个字符,除了换行符,尽可能多。

推荐阅读