python - 既不是正则表达式,也不是fuzzywuzzy也不是tre的模糊匹配的Python3.6包?
问题描述
我正在寻找可以让我在 Python 3.6 中模糊匹配的东西,而无需使用以下已废弃的库/包(不是我的项目,所以除非我找到解决这些库问题的解决方案,否则我无法做出决定) :
- laurikari 的 tre 库(在安装过程中令人头疼,而且几乎没有文档可以帮助解决该问题)
- 用于模糊匹配的 re/regex 选项(处理时间太长)
- Fuzzywuzzy(未经官方测试,使其对我的项目不可靠)
我一直在寻找解决方案,但我似乎没有找到它......帮助?
解决方案
模糊匹配依赖于文本之间的距离度量。您可以只使用一个函数来计算代码中的“levenshtein”(或任何其他指标)(例如https://www.datacamp.com/community/tutorials/fuzzy-string-python)。这样你就不需要任何外部依赖。只需循环可能的匹配,计算距离并选择距离最小的匹配(最大相似性)。
如果您想要一个外部库,而不是您的“黑名单”中的一个,请尝试https://pypi.org/project/textdistance/
推荐阅读
- email - CRM?是这个名字吗?
- python - 如何将多个文本文件加载到 Google 文本转语音中?
- android - POS蓝牙打印机在启动时留下一些边距,然后在Android App中开始打印
- javascript - new Date().getTime() 在 JavaScript 中显示 NaN
- python - 在滚动视图中按下按钮以切换到另一个屏幕 [Kivy]
- react-native - 世博会弹出后反应本机问题
- sql - 查询以使用 like 运算符连接两个表
- google-chrome-extension - 替换页面上的文本值或显示与网站上显示的 id 匹配的值的叠加层
- python - RandomizedSearchCV Pipeline 使用mutual_info_classif 选择SelectPercentile 的超参数
- c# - 如何使用 Android 的统一从 URL 加载 JSON?