首页 > 解决方案 > 如何从python中的文本文档中删除所有标点符号和其他符号?

问题描述

我想清理数据集以进行分类。我想从文本中删除所有无用的符号。

如何删除所有这些无用的符号,以便文本准备好进行标记和拆分?

标签: python-3.xsymbolsdata-cleaning

解决方案


使用此代码,您可以从字符串中删除一个字符:

x = "abcdef"
x = x.replace("a", "")
print(x)
#output: "bcdef"

如果您想删除多个字符,您可以多次使用替换功能和另一个字符,或者您可以执行以下操作:

x = "abcdef"
to_remove = "be"
for i in to_remove:
    x = x.replace(i, "")
print(x)
#output: "acdf"

推荐阅读