java - 使用二进制序列查找字符的编码
问题描述
我在 XML 中遇到了以下文本:
<name>21&ª</name>
有一个编码问题导致文本21"
变成这些字符。请注意,我在这里使用键盘输入了双引号,但实际上它可能是那些 microsoft word 自动替换的双引号之一。我使用 UTF-8 将这些奇怪的字符分解为以下字节,因为这就是我的 Java 代码的 Xstream 库所做的:

= 00011001&
= 00100110- ª =
ª
= 11000010 10101010
所以总的来说,奇怪的双引号字符以某种方式导致了这些字节:
00011001 00100110 11000010 10101010
使用所有这些知识,我想知道找到作为我们系统输入的编码和原始字符。换句话说,哪个非 utf8 字符导致了那个字节序列?我需要哪种编码将这些字节转换回原始字符?我尝试了一些在线转换器,但它们都假设为 ascci 或 UTf-8,并且不让我为我尝试设置不同的编码。
解决方案
推荐阅读
- python - 计算其他值时动态移动平均值
- git - pythonanywhere 是否允许在免费帐户中安装其他 Git 版本?
- gulp - Gulp v4 不更新浏览器
- javascript - Object.keys() 返回在 Ant Design 表格列渲染中不起作用
- javascript - 如何使用 localstorage 和 Jquery 从多个点击事件中生成一个包含一组存储值的对象键
- python-3.x - TypeError: 'float' 对象不能被解释为 stride_trick.as_strided 中的整数
- unity3d - 如何从 Mixamo 中删除上传的角色
- regex - 使用正则表达式确定这两种情况
- typescript - “”的这种行为是 TypeScript 类型系统错误吗?
- physics-engine - PAL(物理抽象层)仍然是一个可行的实用程序吗?