python - 如何将字符串转换为“gbk”编码?
问题描述
我正在尝试使用 Python 将一些中文单词转换为字节。例如,我有这个词:自 我试图通过这样做来转换它:
"自".encode()
但我只得到这个:
b'\xe8\x87\xaa'
在网上看,我认为它需要使用“gbk”编码进行转换,但如果我尝试这样做,我只会得到:
b'\xd7\xd4'
我需要的是它被转换成这个:
\u81ea
在这里您可以看到对我正在谈论的角色的引用:https ://charbase.com/81EA
解决方案
\u81ea
是 unicode 代码点而不是 gbk 字节。
您可以使用以下方法转换为:
"自".encode("unicode_escape")
# b'\\u81ea'
b'\xd7\xd4'
是那个码位的gbk编码,b'\xe8\x87\xaa'
是同一个码位的utf-8编码。
推荐阅读
- javascript - 迁移失败并出现错误:table.integer(...).references(...).on(...).OnDelete is not a function Knex.js postgres
- java - 使用 Java Stream - 独立处理两半流
- elasticsearch - ElasticSearch - 查询中的所有单词都必须匹配
- python-3.x - “地图”对象不可下标
- linux - 如何使用 Pyshark 捕获具有特定通道的 wifi 数据包?
- javascript - 拖动时的 Interact.js 克隆(在 vue 组件中)
- python - 重新编号序列以消除间隙,但保持相同的数字
- javascript - 如何将javascript变量传递给innerhtml内部的flask url_for?
- python - Django Managemengt 命令记录加入消息
- android - lint 改进后可空运行时崩溃