首页 > 解决方案 > 如何在 Python 中将“原始”字符串转换为“解码”字符串?

问题描述

我有以下字符串:

raw_text  = r"The Walt Disney Company, (2006\u2013present)"    
print(raw_text)
#result : The Walt Disney Company, (2006\u2013present)

我的问题是如何从 raw_text 中获取解码的字符串“decoded_text”,这样我就可以得到

print(decoded_text)
#result : The Walt Disney Company, (2006-present)

除了这种简单的方式:

decoded_text = raw_text.replace("\u2013", "-")

事实上,我有很大的字符串,其中包含很多 \u-- 内容(如 \u2013、\u00c9 等)。所以我正在寻找一种方法以正确的方式一次转换所有这些。

标签: pythonstringtype-conversionrawstring

解决方案


您可能会为此任务使用内置的编解码器模块,如下所示

import codecs
raw_text  = r"The Walt Disney Company, (2006\u2013present)"
print(codecs.unicode_escape_decode(raw_text)[0])

输出:

The Walt Disney Company, (2006–present)

推荐阅读