首页 > 解决方案 > 设计一个正则表达式以排除带有反斜杠的字符串部分

问题描述

我正在尝试从具有额外字符的 csv 文件中清理一列字符串。我正在尝试使用以下正则表达式:(r'([A-Za-z0-9\s]+)')在诸如'Robert Johnson\xa0'提取 just之类'Robert Johnson'的字符串上,但结果字符串未更改。不确定如何修改正则表达式,使其'\xa0'不包含在最终字符串中。

标签: pythonregexpandas

解决方案


如果您需要在字符串中提取的所有内容都不包括数字。那么这应该工作

(r'([A-Za-z]+)\b') 

推荐阅读