首页 > 解决方案 > R:模糊合并两个数据框

问题描述

我有 2 个数据框。

第一的,

abc <- data.frame(bin1 = c("0-25K", "25K-50K", "50K+"), group1 = c(1, 1, 2), bin2 = c("0-25", "25-50", "50+"), group2 = c(1, 2, 2))

pqr <- data.frame(bin1 = c("1_0-25K", "2_25K-50K", "3_50K+"),bin2 = c("0,25", "25,50", "50+"))

我想合并 abc 和 pqr 得到

pqr <- data.frame(bin1 = c("1_0-25K", "2_25K-50K", "3_50K+"), group1 = c(1, 1, 2), bin2 = c("0,25", "25,50", "50+"), group2 = c(1, 2, 2))

我查看了一些较早发布的问题,但没有一个对我有用。

在 R 中使用模糊/近似字符串匹配合并两个数据帧

标签: rfuzzyjoin

解决方案


这有效:

library(fuzzyjoin)
pqr <- pqr %>% stringdist_inner_join(abc, by = c(bin1 = "bin1"))

推荐阅读