首页 > 解决方案 > 最高可用 UNICODE 字符

问题描述

我正在编写一个将大数字保存到文件中的例程,但我不想将实际数字写为字符串(例如 999999),而是使用其等效的 UNICODE 字符(例如 ),不管它是否真的对应于可见或可识别的字符。排除代理对,有谁知道哪些数值对应于一个 Unicode 字符?我问这个是因为我注意到某些数值对应于两个字符的 Unicode 代码点。前任。999999 对应于 ,而 999998 对应于 。

标签: c#unicode

解决方案


Unicode 当前定义为以 10_ffff₁₆ = 1_114_111₁₀ 结尾。某些语言能够放宽该限制,例如

#!/usr/bin/env perl
"\x{7fff_ffff_ffff_ffff}";
# ÿ¿¿¿¿¿¿¿¿¿¿
encode "UTF8", "\x{7fff_ffff_ffff_ffff}";
# 0xff 0x80 0x87 0xbf 0xbf 0xbf 0xbf 0xbf 0xbf 0xbf 0xbf 0xbf 0xbf

推荐阅读