首页 > 解决方案 > 每个字节的第一位设置为 0 的文件

问题描述

我得到了一个似乎以 UTF-8 编码的文件,但每个应该以 1 开头的字节都以 0 开头。

例如,在人们期望以 UTF-8 编码为 的波兰字母“ę”的地方\o304\o231,有\o104\o031. 或者,在二进制中,有01000100:00011001而不是11000100:10011001.

我认为这不是由让我头疼的邪恶文件创建者故意这样做的,而是对正确的 UTF-8 文件执行一些错误操作的结果。

问题是:什么“合理”的操作可能是原因?我不知道该文件是如何创建的,可能它是由某些未知软件导出的,可能已经被压缩、上传、复制和粘贴、转换为另一种编码等。

我会很感激任何想法:)

标签: utf-8character-encodingutf

解决方案


推荐阅读