python - 有没有办法在文件名中搜索非英文字母?
问题描述
我正在尝试编写一个脚本,将文件名中的所有非英文字母替换为英文对应的字母,这可能吗?
解决方案
如果您的意思是“去毛刺”字符串,那么有一个很好的、简单的配方(无论如何对于许多重音字符),它使用 Unicode NFKD 规范化形式,然后从其中去除所有非 ascii 的内容:
>>> import unicodedata
>>> unicodedata.normalize("NFKD", "törkylempijävongahdus").encode("ascii", "ignore").decode()
'torkylempijavongahdus'
对于更复杂的用例,也许https://pypi.org/project/transliterate/是你的事。
推荐阅读
- curl - 为什么使用 curl 查询完整的网站会出现 405 错误?
- python - BeautifulSoup 找不到页面中的每个链接
- winapi - WinAPI Combobox 不能使用数字?
- c# - 从 MetaDataLoadContext 创建类型/属性的实例
- outlook - 如何借助日历图 api 识别系列中更新的子事件(rucurring 事件)?
- airflow - DAG 回填在 SQL 表上同时竞争插入和删除
- php - 如何删除用php编写的最后一列边框?
- flutter - 如何连接到本地主机?
- prolog - Prolog 程序不存在(无法在 prolog 中运行规则)
- google-sheets - 您可以使用 vlookup 在 Google 表格中创建下拉列表吗?