首页 > 解决方案 > 从python中的内置未知字符替换字符串

问题描述

我正在尝试将此处下面这个无法识别的文本替换为另一个文本。我所做的是将其解码为 UTF-8 并尝试替换下面的未知文本。

“你……”

varlistlabela = spss.GetVariableLabel(var)
varlistlabela=varlistlabela.decode("cp1252").replace(r'[\u0020-\ud7ff]',"").encode("cp1252") 

标签: pythonunicodedecode

解决方案


您需要一个正则表达式替换:

re.sub(r'[^\u0020-\ud7ff]', '', s)

s输入字符串在哪里。

代码

import re

s = " you�"
print(re.sub(r'[^\u0020-\ud7ff]', '', s))
#  you

推荐阅读