首页 > 解决方案 > 如何使用 Python 3 将字符串中的所有 unicode 代码“翻译”为实际符号?

问题描述

标签: pythonunicodeutf-8urllibnon-ascii-characters

解决方案


urllib 返回字节:

>import urllib
>url = 'https://stackoverflow.com/questions/62085906'
>data = urllib.request.urlopen(url).read()
>type(data)
bytes
>idx = data.index(b'characters like')
>data[idx:idx+20]
b'characters like "\xc3\xa7"'

现在,让我们尝试将其解释为 utf-8:

>data[idx:idx+20].decode('utf-8')
'characters like "ç"'

瞧!


推荐阅读