python - 文本数据的数据框,删除符号以清理文本
问题描述
我有一个大型数据框,其中有一列包含大量电子邮件索引。不用说,有很多符号我想去掉,这样我就可以处理数据了。我发现以下代码有效:
test=test.str.replace('&','')
但是,我还想删除 /123456789#[!^>]。但是当我尝试这样做时,数据框会消失:
test=test.str.replace('#','/','')
关于我做错了什么有什么想法吗?
谢谢你的时间。
解决方案
你可以使用正则表达式
import re
s = '145&&!*Hi!#$#%@*+_{ '
reg = re.compile('[^a-zA-Z ]')
print(reg.sub('', s))
输出:嗨
推荐阅读
- javascript - 我怎样才能延迟 .then 承诺?
- c++ - 从文件中读取直到行尾并为后续行重复该过程
- android - ListView 项目出现或消失时如何获取回调?
- python-3.x - SARIMAX - 汇总表系数符号在调用时反转
- scala - Scala宏:如何获取给定包中继承某些特征的对象列表?
- c++ - 对于文件中的每个不同单词,显示该单词在文件中出现的次数
- c - 模拟 C 程序的服务器端 GET 请求
- unix - Unix命令在字符串之前按长度删除特定字段之前
- cassandra - Cassandra 触发器 - 空单元格/列
- xml - 使用 XSLT 将 XML 值保存到变量