首页 > 解决方案 > 如何将字符串转换为“gbk”编码?

问题描述

我正在尝试使用 Python 将一些中文单词转换为字节。例如,我有这个词:自 我试图通过这样做来转换它:

"自".encode()

但我只得到这个:

b'\xe8\x87\xaa'

在网上看,我认为它需要使用“gbk”编码进行转换,但如果我尝试这样做,我只会得到:

b'\xd7\xd4'

我需要的是它被转换成这个:

\u81ea

在这里您可以看到对我正在谈论的角色的引用:https ://charbase.com/81EA

标签: pythonbyteencodecjk

解决方案


\u81ea是 unicode 代码点而不是 gbk 字节。

您可以使用以下方法转换为:

"自".encode("unicode_escape")
# b'\\u81ea'

b'\xd7\xd4'是那个码位的gbk编码,b'\xe8\x87\xaa'是同一个码位的utf-8编码。


推荐阅读