首页 > 解决方案 > 匹配不带字母 a 的字符串

问题描述

如何匹配 2 个标记的单词部分,即字母a和有效单词。

例如;

我目前正在查看一个大型数据集,并希望在我的机器学习分类器中删除不必要的字母,但该字母a在我的 2 个单词中算作一个单词。

如何在没有正则表达式的 a 的情况下返回单词?

标签: pythonregex

解决方案


此正则表达式捕获 every aan后跟一个空格。它还检查a&前面是否没有字母,an或者它是否是字符串中的第一个字母。

(?:[^A-z]|^)(a|A|an|An)\s

这应该基本上涵盖所有语法正确的文本。


推荐阅读