首页 > 解决方案 > 如何标准化字体?

问题描述

用户有时会在程序中使用奇怪的 ASCII 字符,我想知道是否有办法“规范化”它。

所以基本上,如果输入ᴀʙᴄᴅᴇꜰɢ,输出将是ABCDEFG。是否有一个字典存在于某处做这样的事情?str.replace("ᴀ", "A")如果没有,有没有比只为所有不同的“字体”做类似的事情更好的方法?

这不是一个特定于语言的问题——如果不存在这样的东西,我猜下一步就是自己创建一个字典。

标签: unicodenormalize

解决方案


您的示例似乎涉及 unicode 字符,而不是 ASCII 字符。 Unicode 规范化( FAQ ) 是一个庞大而复杂的主题,具有许多不同的字符等价类,具体取决于您要执行的操作。


推荐阅读