首页 > 解决方案 > 将字符串解码为 UTF-8(URL/百分比编码字符串)

问题描述

在我的 Python 3 程序中,我遇到过奇怪的编码字符串,例如“abol%C3%A2t”(abolât)和“%C5%93ufs”(œufs)。我从 WiktionaryParser 得到它们。

我只找到了将其编码为 UTF-8 以获取可引用打印字符串的方法,但这里不是这种情况。如何将字符串从“%C3%A9vitables”更改为“évitables”?

标签: pythonstringencodingurlencode

解决方案


这些字符串是百分比编码的。使用urllib.parse模块对它们进行解码:

import urllib.parse

s = "%C5%93ufs"
s = urllib.parse.unquote(s)

推荐阅读