首页 > 解决方案 > 西班牙语字符 ó 从 PHP 中的正则表达式中被破坏

问题描述

我正在编写一个需要扫描文本块中单词的脚本。其中一部分包括将文本清理为纯单词,除了复合词的撇号之外没有添加标点符号,但是每次我通过这一行时,一个特定西班牙字符的编码似乎都会中断:

$content = preg_replace("/[^a-zA-Z'’`ÀàÂâÆæÈèÉéÊêËëÎîÏïÔôŒœÙùÛûÜüŸÿüáÁéÉíÍñÑóÓúÚüÜ¿¡«»]/iu", " ", $content);

有问题的字符是ó. liquidación在这种情况下,我正在测试 Liquidación 这个词,当我打印出结果时它又回来了。

有没有办法解决这个问题,或者有更好的方法来清理文本块,同时保留英语、法语和西班牙语字符?

标签: phpregex

解决方案


推荐阅读