regex - 如何识别单词边界中的德语变音符号?
问题描述
我的问题可以在这个例子中看到:https ://regex101.com/r/dToBvm/1/
我正在尝试使用此正则表达式来捕捉所有单词\b([äöüÄÖÜß\w]+)\b
有趣的是“säs”会匹配,但不会匹配“äss”或“sää”。如果一个单词以变音符号开头或以它结尾,那么它将不匹配。
我该如何解决这个问题?
解决方案
因为单词边界匹配 between ä
and s
inäss
和 between s
and ä
in sää
(这\b
就是定义的方式)。
您需要使用负面环视来实现您想要的:
(?<![äöüÄÖÜß\w])([äöüÄÖÜß\w]+)(?![äöüÄÖÜß\w])
推荐阅读
- r - 无法使用 Rvest 包从 RSS 提要中提取链接
- javascript - 深度嵌套的数组和对象
- java - 我们如何替换用户输入中的字符?
- python - 在 AWS Lambda 上运行 Selenium
- scala - 在 Spark 上使用 foreachPartition 发出 HTTP 发布请求
- html - Shinydashboard侧边栏面板输入字段标签中的内联图标
- postgresql - Postgres 在循环中为选定列中的所有值插入 N 行
- asp.net-core - 在反向代理后面使用 JwtBearerOptions.RequireHttpsMetadata=false 可以吗?
- r - 在 R 中使用 ggplot2 的基本绘图
- oracle - 响应计划作业的完成