首页 > 解决方案 > 如何在保留空格的同时删除包含字符串的系列中的非字母数字(英文)字符?

问题描述

目前,我有:

[re.sub(r'\W', '', i) for i in training_data.loc[:, 'Text']]

然而,印地语字符仍然存在,所有空格都被删除。有任何想法吗?

标签: pythonpandasnlp

解决方案


否定可能会有所帮助

import re
import string    

re.sub(f'[^{string.printable}]', '', 'asdf #$שדגכ')

推荐阅读