unicode - 如何标准化字体?
问题描述
用户有时会在程序中使用奇怪的 ASCII 字符,我想知道是否有办法“规范化”它。
所以基本上,如果输入ᴀʙᴄᴅᴇꜰɢ
,输出将是ABCDEFG
。是否有一个字典存在于某处做这样的事情?str.replace("ᴀ", "A")
如果没有,有没有比只为所有不同的“字体”做类似的事情更好的方法?
这不是一个特定于语言的问题——如果不存在这样的东西,我猜下一步就是自己创建一个字典。
解决方案
您的示例似乎涉及 unicode 字符,而不是 ASCII 字符。 Unicode 规范化( FAQ ) 是一个庞大而复杂的主题,具有许多不同的字符等价类,具体取决于您要执行的操作。
推荐阅读
- javascript - 如何使用多个字符串来匹配javascript中的字符串前缀?
- php - 使用 PHP 将整数插入 MySQL 数据库时遇到问题
- android - BroadCastReceiver Battery 不被调用
- javascript - 页面使用角度路由器在浏览器中显示两次?
- python - 使用均值和标准导数进行归一化
- reactjs - 使用 onChange 在功能组件中设置状态时 NumberPicker 循环
- python - 从划分为组的现有列在 Pandas 中生成新列
- c - 如何使用 C 中的指针仅释放数组的一部分?
- sql - SQL CASE when with embedded CASE when 语句
- c - 试图用 bison 和 flex 制作计算器,但它只打印出 0