utf-8 - 每个字节的第一位设置为 0 的文件
问题描述
我得到了一个似乎以 UTF-8 编码的文件,但每个应该以 1 开头的字节都以 0 开头。
例如,在人们期望以 UTF-8 编码为 的波兰字母“ę”的地方\o304\o231
,有\o104\o031
. 或者,在二进制中,有01000100:00011001
而不是11000100:10011001
.
我认为这不是由让我头疼的邪恶文件创建者故意这样做的,而是对正确的 UTF-8 文件执行一些错误操作的结果。
问题是:什么“合理”的操作可能是原因?我不知道该文件是如何创建的,可能它是由某些未知软件导出的,可能已经被压缩、上传、复制和粘贴、转换为另一种编码等。
我会很感激任何想法:)
解决方案
推荐阅读
- batch-file - 如果文件大小超过 0 KB,如何将文件从源复制到目标?
- python - 如何使用python在Tensorflow、CNN中创建学习模型的多个实例?
- javascript - 比例因子的计算
- flutter - 我无法将控制器映射发送到返回小部件的功能?
- flutter - 专业应用程序必须使用 bloc 模式吗?
- r - 如何从数据库中采样记录而不重复?
- javascript - 正则表达式用加号替换除最后 5 个字符和空格之外的所有字符
- r - 在包小插图中从 GitHub 安装 R 包
- c - 计算每个子目录的文件数 - C (POSIX) 中的程序
- python - 如何从 os.path.dirname(__file__) 返回的路径中删除 PythonCode?