首页 > 解决方案 > 从字符串列表中删除空格变化的 Python 最佳实践

问题描述

是否有从 Python 中的字符串中删除奇怪的空白 unicode 字符的最佳实践?

例如,如果一个字符串包含此中的以下 unicode 之一,我想将其删除。

我正在考虑将 unicodes 放入一个列表中,然后使用 replace 进行循环,但我确信有一种更 Pythonic 的方式。

标签: pythondata-cleaningremoving-whitespace

解决方案


你应该可以使用这个

[''.join(letter for letter in word if not letter.isspace()) for word in word_list] 

因为如果您阅读文档,str.isspace它会说:

True如果字符串中只有空白字符且至少有一个字符,则返回,否则返回 False。

如果在 Unicode 字符数据库(参见 unicodedata)中,一个字符是空白字符,或者它的一般类别是Zs(“分隔符,空格”),或者它的双向类是 WS、B 或 S 之一。

如果您查看category的unicode 字符列表Zs


推荐阅读