首页 > 解决方案 > Unicode、UTF-8 和代码页之间的区别

问题描述

谁能解释一下 Unicode、UTF-8 和代码页之间的区别是什么?它们相互关联吗?

标签: unicodeencodingutf-8character

解决方案


Unicode 为每个字符定义了一个数值(代码点)。

代码页/字符集编码定义了字节和 Unicode 代码点之间的关系。由于文件通常由字节组成,因此确定这一点很有用。

UTF-8 是 Unicode 代码点的特定字节编码。例如,在 Windows 上,它被实现为代码页 65001。


推荐阅读