首页 > 解决方案 > oracle 19c 中正则表达式函数的奇怪行为

问题描述

我不是正则表达式的专家,但默认情况下应该区分大小写。我试图弄清楚为什么当第一个是大写时,正则表达式给了我前两个字符

select regexp_substr('JohnFoo','[a-z]{2}') from dual;

输出是“乔”

如果我试过这个

select regexp_substr('JohnFoo','^[a-z]{2}') from dual;

输出是相同的,但它应该在开头识别 2 个非大写字母,所以在这种情况下不匹配

然后我对所有论点都尝试了同样的方法

select regexp_substr('JohnFoo','[a-z]{2}',1,1,'c') from dual;

再次输出是 'oh' 的 'Jo' instrad

我做错了什么?这种行为与 substr 相同,也可以替换。在我看来就像忽略大写字母

标签: stringoracleregexp-replaceregexp-substrnls-sort

解决方案


您应该首先检查NLS会话中的设置。排序提供了您期望的行为BINARY,而您可能没有指定它。

下面是一个小例子

ALTER SESSION SET NLS_COMP=BINARY;
ALTER SESSION SET NLS_SORT=BINARY;

select regexp_substr('JohnFoo','[a-z]{2}') from dual;

RE
--
oh

ALTER SESSION SET NLS_COMP=LINGUISTIC;
ALTER SESSION SET NLS_SORT=BINARY_CI;

select regexp_substr('JohnFoo','[a-z]{2}') from dual;

RE
--
Jo

要获取您的实际会话值,请使用查询

select * from NLS_SESSION_PARAMETERS 
where parameter in ('NLS_COMP','NLS_SORT');

推荐阅读