python - 为什么我的 python re 模式不适用于空格分割?
问题描述
我试图用英语和俄语的所有标点符号分割文本。这适用于空格。出于某种原因 \s 无法正常工作。allRussianWords 最终包含空格,但我不希望它。
allRussianWords = re.split("[—…();«»!?.:,%\s\n]",words)
这是我试图分割
words = "привет, моё имя Мэтт. Как ты?"
标点符号的字符串是俄语
解决方案
似乎您需要在右方括号后加上一个 + 来匹配连续字符。其他答案之一也指出了这一点。
\n 也是多余的,因为 \s 包含换行符。
推荐阅读
- python - 在 Mac 上安装 mysqlclient 时出错
- python - 用大型二维向量 Py 计算余弦相似度
- tensorflow - 如何在 Keras 中为 MNIST 观察渐变
- svelte - 浏览器在 svelte-sapper 组件中显示 {#each} 块的问题
- javascript - 无法在 javascript 中设置 cookie 过期日期
- javascript - Angular - 将输入传递给 ng-content 组件
- javascript - 显示从 puppeteer 抓取的数据到 react 应用程序
- amazon-web-services - 无法使用其私有域连接到 Lightsail 中的 AWS 容器服务
- polymorphism - 如何使用 StringTemplate 在循环中进行多态性?
- nlp - “n-gram 袋”的正确实现是什么?