首页 > 解决方案 > 为什么我的 python re 模式不适用于空格分割?

问题描述

我试图用英语和俄语的所有标点符号分割文本。这适用于空格。出于某种原因 \s 无法正常工作。allRussianWords 最终包含空格,但我不希望它。 allRussianWords = re.split("[—…();«»!?.:,%\s\n]",words)

这是我试图分割 words = "привет, моё имя Мэтт. Как ты?" 标点符号的字符串是俄语

标签: pythonsplitspacespacesre

解决方案


似乎您需要在右方括号后加上一个 + 来匹配连续字符。其他答案之一也指出了这一点。

\n 也是多余的,因为 \s 包含换行符。


推荐阅读