首页 > 解决方案 > 有没有办法识别或返回导致python中编辑距离中两个单词之间差异的字符?

问题描述

我正在寻找拼写错误中的模式。我可以使用编辑距离来查看 2 个单词(正确单词和候选单词)的相似程度。但是,我也很想知道哪些字符有助于造成这两个词之间的差异。

标签: pythonstringmachine-learningnlpedit-distance

解决方案


这取决于您使用的库和方法。例如,在这个库中,您可以使用editops函数来查找除了两个字符串的 Levenstein 距离之外的所有编辑操作:

editops('spam', 'park')
# [('delete', 0, 0), ('insert', 3, 2), ('replace', 3, 3)]

推荐阅读