首页 > 解决方案 > 两个列表之间的向量化距离计算

问题描述

我有两个列表,例如,

list A = ['ABCD', 'AC', 'BCD']
list B = ['BCDD', 'AB']

对于列表A中的每个元素,我想计算列表B的编辑距离(levenshtein距离)并计算小于3的结果数。也就是说,最终结果应该给出一个列表。在上面的示例中,我希望结果是:[1, 1, 1]

我的代码是:

for element in listA:
    sub_len = sum(np.array(vdistance(element, listB)) <= 2)

这适用于小样本,但是,当列表 A 和 B 的大小是两个大时,速度变得非常小。我想知道是否有任何矢量化方法可以实现我的目标,谢谢!

标签: pythonvectorization

解决方案


推荐阅读