首页 > 解决方案 > 如何比较同一数据集之间的链接?我只想比较不同的个体,但在同一个数据集中(df_mn)

问题描述

如何比较同一数据集之间的链接?我只想比较不同的个体,但在同一个数据集中(df_mn)

我试过了:

indexer = recordlinkage.Index()
indexer.block('surname')
candidate_links = indexer.index(df_mn,df_mn)
compare_cl = recordlinkage.Compare()

compare_cl.string('surname', 'surname', label='surname')
features = compare_cl.compute(candidate_links, df_mn, df_mn)

标签: record-linkage

解决方案


推荐阅读