首页 > 解决方案 > 如何从plsql中的字符串中提取几个指定的字母数字整个单词之前的文本

问题描述

如何从字符串中删除特定字母数字值之后的所有字符,例如“covid19 1st case”如果我们在第一个之后删除字符串,则应该是“covid19”;在“covid19 2d case”的情况下,如果我们在 2d 之后删除字符串,它应该是“covid19”我正在尝试下面的查询

select regexp_substr('covid19 1st case','[^1st]*') from dual;

但它给covid作为输出任何线索。如果我们有预定义的字母数字值,我们可以在单个表达式中做到这一点,就像我们可以删除第 1 次和第 2 次之后的所有字符串一样。

谢谢

标签: regexoracleplsqlregexp-substr

解决方案


您可以使用

select regexp_substr('covid19 1st case','^(.*?)\s+(1st|2d)($|\W)', 1, 1, NULL, 1) from dual;
select regexp_substr('covid19 1st case','^(.*?)\s*(^|\W)(1st|2d)($|\W)', 1, 1, NULL, 1) from dual;

请参阅正则表达式演示 #1正则表达式演示 #2

和用于代替 Oracle SQL 正(^|\W)($|\W)表达式引擎不支持的字边界。

详情

  • ^- 字符串的开始
  • (.*?)- 第 1 组:除换行符之外的任何零个或多个字符尽可能少
  • \s*- 零个或多个空格(\s+匹配一个或多个)
  • (^|\W)- 第 2 组:字符串开头或非单词字符
  • (1st|2d)- 第 3 组:1st或者2d
  • ($|\W)- 第 4 组:字符串结尾或非单词字符。

另一个变体是使用REGEXP_REPLACE(您只需要匹配字符串的其余部分):

select regexp_replace('covid19 1st case','^(.*?)\s*(\W|^)(1st|2d)(\W|$).*', '\1') from dual;

请参阅此正则表达式演示\1指的是 Group 1 值。


推荐阅读