首页 > 解决方案 > 在 python 中解码 utf-8

问题描述

我有一个像这样的表达式,它产生 utf-8 表示的字节列表。

list(chr(number).encode("utf-8"))

但是如何反过来呢?

说,我有 2 个字节 [292, 200] 作为列表,如何将它们解码为符号?

标签: pythonutf-8

解决方案


您可以调用bytes0..255 范围内的整数列表。

因此,您的示例反转如下:

>>> bytes([195, 136]).decode('utf8')
'È'

如果您想要代码点,请将其包装在ord()

>>> ord(bytes([195, 136]).decode('utf8'))
200

注意:仅当字节序列对应于单个 Unicode 字符(代码点)时,最后一步才有效。


推荐阅读