unicode - 如何将包含的 UTF-8 二进制文件的错误 unicode 转换为 str?
问题描述
在 python2.7 中,我得到了这样的 unicode s = u'\xe5\x86\x80AC5S'
。实际上它是一个包含汉字的车牌,我测试了 '\xe5\x86\x80',它是 UTF-8 二进制文件。
我得到了一个使用s = s.encode('latin-1')
then s == '\xe5\x86\x80AC5S' 的解决方案,该解决方案解释了 U+0000 和 U+00FF 之间的代码点映射到 ISO 8859-1 或拉丁 1 编码中的相同字节值。
但是现在,我混淆了 unicode 存储模式。当我写为 = u'somedata' 时,ide 得到 defaultencoing(),我的 ide 是 utf-8,我认为 s 转换为 utf-8 的 unicode,我的意思是 s 以十六进制而不是 U+0000 方式存储。我哪里理解错了?请帮忙!!
解决方案
推荐阅读
- oracle - 如何在 Oracle 中删除字段末尾的空字节
- c# - Xamarin 闪屏
- html - 加载资源失败:服务器在 Nodejs 应用程序中响应状态为 404(未找到)问题
- angular - 为角度“mat-tab-nav-bar”设置活动选项卡
- reactive-programming - Scheduler.elastic() 只创建两个线程,它会在什么基础上创建线程,VM 的 CPU 处理器?
- robotframework - 机器人套件设置/拆卸
- docker - jupyter notebook 在远程服务器上的 docker 中运行:keras 不使用 gpu
- java - Gradle:如何在 Gradle 插件中派生项目目录路径?
- reactjs - 为什么这个组件在状态改变时会渲染两次?
- flutter - 如何使用字符串访问属性或方法?