python - Unicode 字符名称的官方存储库
问题描述
有几种方法可以获取所有 Unicode 字符名称的列表:例如使用 Python 模块unicodedata
,如Unicode 字符名称列表中所述,或者使用网站:https ://unicode.org/charts/charindex.html但是这里不完整,您必须打开并解析 PDF 才能找到名称。
但是所有 Unicode 字符名称的官方来源/存储库是什么?(这样,如果添加了一个新字符,列表就会更新,所以我正在寻找这些名称的初始来源,以机器可读的格式)。
我正在寻找一个只有code point
and的列表name
,CSV 或任何其他格式:
code character name
...
0102 LATIN CAPITAL LETTER A WITH BREVE
0103 LATIN SMALL LETTER A WITH BREVE
...
解决方案
实际字符数据(包括字符名称和许多其他详细信息)的官方来源是Unicode 字符数据库。
可以通过http://www.unicode.org/Public/UCD/latest/访问最新版本的数据文件。
具体名称可以在文件NamesList.txt
中找到。该文件的格式在此处描述。
这是 CSV 格式的列表:https ://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt
推荐阅读
- html - 如何修复侧边栏将页面扩展得太远
- python - 如何在 Python 中绘制幅度突然变化的正弦波?
- scala - 从 spark 数据框中提取 2 个值的最优雅方法是什么?
- javascript - 将日期范围验证添加到 Saturn-datepicker
- r - 如何从 R 中的复杂 XML 中提取值而不丢弃没有现有值的节点?
- python - C服务器套接字拒绝python客户端的连接
- c# - c#中的DateTime.TryParseExact给出错误的值
- php - 如何使用 php_seclib 执行命令
- reactjs - Recharts:将工具提示光标定位在活动点上
- netflix-zuul - 如何将netflix zuul 1迁移到zuul 2或spring cloud gateway