首页 > 解决方案 > 正则表达式自 PHP 7.4 以来失败,在 7.3 中工作

问题描述

任何想法为什么这个 preg_match 可以在 PHP7.2 上运行但在 7.3+ 上失败?

$word = 'umweltfreundilch'; //real life example :/
preg_match('/^(?U)(.*(?:[aeiouyäöü])(?:[^aeiouyäöü]))(?X)(.*)$/u', $word, $matches);
var_dump($matches);

警告:preg_match():编译失败:(? 或 (?-

PHP 7.2 及以下输出:

array(3) {
  [0]=>
  string(16) "umweltfreundilch"
  [1]=>
  string(2) "um"
  [2]=>
  string(14) "weltfreundilch"
}

RegEx 似乎没问题,不是吗?
https://regex101.com/r/LGdhaM/1

标签: phpregexpreg-match

解决方案


在 PHP 7.3 及更高版本中,Perl 兼容正则表达式 (PCRE) 扩展已升级到 PCRE2。

PCRE2 语法文档未将其(?X)列为可用的内联修饰符选项。以下是支持的选项:

  (?i)            caseless
  (?J)            allow duplicate named groups
  (?m)            multiline
  (?n)            no auto capture
  (?s)            single line (dotall)
  (?U)            default ungreedy (lazy)
  (?x)            extended: ignore white space except in classes
  (?xx)           as (?x) but also ignore space and tab in classes
  (?-...)         unset option(s)
  (?^)            unset imnsx options

但是,您实际上可以X在尾随分隔符之后使用标志:

preg_match('/^(?U)(.*[aeiouyäöü][^aeiouyäöü])(.*)$/Xu', $word, $matches)

请参阅PHP 7.4 演示

要取消(?U)效果,您可以使用以下两个选项之一:(?-U)内联修饰符,如 in

preg_match('/^(?U)(.*[aeiouyäöü][^aeiouyäöü])(?-U)(.*)$/u', $word, $matches);
//                                           ^^^^^

或者,将受影响的模式包含在(?U:...)修饰符组中:

preg_match('/^(?U:(.*[aeiouyäöü][^aeiouyäöü]))(.*)$/u', $word, $matches);
//            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^        

在 preg_match() 中查看有关 PHP 7.3+ 中正则表达式处理更改的更多信息:编译失败:offset 处的字符类中的无效范围


推荐阅读