首页 > 解决方案 > 使用二进制序列查找字符的编码

问题描述

我在 XML 中遇到了以下文本:

<name>21&#x19;&amp;ª</name>

有一个编码问题导致文本21"变成这些字符。请注意,我在这里使用键盘输入了双引号,但实际上它可能是那些 microsoft word 自动替换的双引号之一。我使用 UTF-8 将这些奇怪的字符分解为以下字节,因为这就是我的 Java 代码的 Xstream 库所做的:

所以总的来说,奇怪的双引号字符以某种方式导致了这些字节:

00011001 00100110 11000010 10101010

使用所有这些知识,我想知道找到作为我们系统输入的编码和原始字符。换句话说,哪个非 utf8 字符导致了那个字节序列?我需要哪种编码将这些字节转换回原始字符?我尝试了一些在线转换器,但它们都假设为 ascci 或 UTf-8,并且不让我为我尝试设置不同的编码。

标签: javacharacter-encodingxstream

解决方案


推荐阅读