首页 > 解决方案 > 如何识别单词边界中的德语变音符号?

问题描述

我的问题可以在这个例子中看到:https ://regex101.com/r/dToBvm/1/

我正在尝试使用此正则表达式来捕捉所有单词\b([äöüÄÖÜß\w]+)\b

有趣的是“säs”会匹配,但不会匹配“äss”或“sää”。如果一个单词以变音符号开头或以它结尾,那么它将不匹配。

我该如何解决这个问题?

标签: regexworddiacritics

解决方案


因为单词边界匹配 between äand sinäss和 between sand äin sää(这\b就是定义的方式)。

您需要使用负面环视来实现您想要的:

(?<![äöüÄÖÜß\w])([äöüÄÖÜß\w]+)(?![äöüÄÖÜß\w])

演示


推荐阅读