首页 > 解决方案 > 如何从文本中删除 \x95 字符 - Pandas?

问题描述

我无法删除熊猫数据框单元格中字符串开头的空格。如果您查看数据框单元格,似乎在字符串的开头有一个空格,但是当您输出一个开头有一组字符的单元格时,它会打印“\x95 12345”,因此您可以看到它不是普通的空格字符,而是 "\x95"

我已经尝试使用strip() - 但它没有帮助。

数据框是在使用str.split(pat=',').tolist()表达式后生成的,该表达式基本上将字符串分成不同的单元格,所以现在我的字符串添加了这个字符。

标签: pythonpython-3.xpandasdata-cleaning

解决方案


假设col1是您的第一个列名:

import re
df.col1 = df.col1.apply(lambda x: re.sub(r'\x95',"",x))

推荐阅读