python - 如何在 Python 中将“原始”字符串转换为“解码”字符串?
问题描述
我有以下字符串:
raw_text = r"The Walt Disney Company, (2006\u2013present)"
print(raw_text)
#result : The Walt Disney Company, (2006\u2013present)
我的问题是如何从 raw_text 中获取解码的字符串“decoded_text”,这样我就可以得到
print(decoded_text)
#result : The Walt Disney Company, (2006-present)
除了这种简单的方式:
decoded_text = raw_text.replace("\u2013", "-")
事实上,我有很大的字符串,其中包含很多 \u-- 内容(如 \u2013、\u00c9 等)。所以我正在寻找一种方法以正确的方式一次转换所有这些。
解决方案
您可能会为此任务使用内置的编解码器模块,如下所示
import codecs
raw_text = r"The Walt Disney Company, (2006\u2013present)"
print(codecs.unicode_escape_decode(raw_text)[0])
输出:
The Walt Disney Company, (2006–present)
推荐阅读
- python - 为什么我不能将 True 存储在 Set 中?
- windows - TPM 消息充斥着我的事件查看器
- mysql - 别名续集
- python - Pyaudio 导入后安装错误
- c++ - CMake 找不到柯南包
- python - 对数组中的数字求和,但忽略区间
- asynchronous - Stream Graph 实现从非并行源到 Flink Kafka Producer 作为并行 Sink 的低延迟管道
- powershell - Powershell Automate 脚本中的属性值不可接受
- wcf - WCF BasicHttpsBinding - 自定义用户名密码验证不起作用且服务未提示输入凭据
- apache-kafka - 如何将来自kafka消费者的数据存储在nagios中