首页 > 解决方案 > 为什么有些供应商将 Unicode 字符映射到另一个字符集(代码页)?

问题描述

我正在阅读一本讨论 .NET 中的文本编码的书:

.NET 中有两类文本编码:

• 将 Unicode 字符映射到另一个字符集的那些

• 使用标准 Unicode 编码方案的那些

第一类包含传统编码,例如 IBM 的 EBCDIC 和 8 位字符集,在 Unicode 之前流行的高 128 区域中具有扩展字符(由代码页标识)。第二类是 UTF-8、UTF-16 和 UTF-32

我对第一个代码页部分感到困惑,我已经阅读了有关 stackoverflow 的一些问题,但没有一个与我要问的问题相同,我的问题是:

为什么有些供应商需要将 Unicode 字符映射到另一个字符集?根据我对Unicode字符的理解,Unicode可以覆盖全世界几乎所有语言的所有字符,为什么要重新发明轮子将Unicode字符映射到另一个字符集呢?例如,unicode 中的换行符是U+000A,为什么要将它映射到其他字符?只要坚持unicode标准,就可以用二进制代码来表示各种字符。

标签: c#.net

解决方案


推荐阅读