首页 > 解决方案 > 有没有办法在文件名中搜索非英文字母?

问题描述

我正在尝试编写一个脚本,将文件名中的所有非英文字母替换为英文对应的字母,这可能吗?

标签: python

解决方案


如果您的意思是“去毛刺”字符串,那么有一个很好的、简单的配方(无论如何对于许多重音字符),它使用 Unicode NFKD 规范化形式,然后从其中去除所有非 ascii 的内容:

>>> import unicodedata
>>> unicodedata.normalize("NFKD", "törkylempijävongahdus").encode("ascii", "ignore").decode()
'torkylempijavongahdus'

对于更复杂的用例,也许https://pypi.org/project/transliterate/是你的事。


推荐阅读