python-3.x - 如何从python中的文本文档中删除所有标点符号和其他符号?
问题描述
我想清理数据集以进行分类。我想从文本中删除所有无用的符号。
如何删除所有这些无用的符号,以便文本准备好进行标记和拆分?
解决方案
使用此代码,您可以从字符串中删除一个字符:
x = "abcdef"
x = x.replace("a", "")
print(x)
#output: "bcdef"
如果您想删除多个字符,您可以多次使用替换功能和另一个字符,或者您可以执行以下操作:
x = "abcdef"
to_remove = "be"
for i in to_remove:
x = x.replace(i, "")
print(x)
#output: "acdf"
推荐阅读
- node.js - 如何使用hapi js返回mongodb查询结果
- c++ - 在 Ubuntu 18.04 上编译 Qt 程序,它将在 Ubuntu 14.04 上运行
- java - 为什么在 Java 中调试(跨步)时 https 连接如此缓慢?
- python - 如何修复 python 用户名和密码列表程序中的错误
- java - 无法使用 Java ping 智能手机
- .net-core - 如何使用 .AddJwtBearer() 在 .NET Core Web API 中验证 AWS Cognito JWT
- security - 在没有用户输入的情况下在lua中执行外部程序作为lua中的参数
- debugging - 如何让Windbg下载MS公共符号压缩版
- macos - Wine64 是如何处理 macOS 的?
- ruby-on-rails - 如何将表单数据保存到2个数据表中?