首页 > 解决方案 > 文本数据的数据框,删除符号以清理文本

问题描述

我有一个大型数据框,其中有一列包含大量电子邮件索引。不用说,有很多符号我想去掉,这样我就可以处理数据了。我发现以下代码有效:

test=test.str.replace('&','')

但是,我还想删除 /123456789#[!^>]。但是当我尝试这样做时,数据框会消失:

test=test.str.replace('#','/','')

关于我做错了什么有什么想法吗?

谢谢你的时间。

标签: pythondataframetext

解决方案


你可以使用正则表达式

import re
s = '145&&!*Hi!#$#%@*+_{ '
reg = re.compile('[^a-zA-Z ]')
print(reg.sub('', s))

输出:嗨


推荐阅读