r - 使用 stringdist_join() 的左连接返回的行数多于开始时的行数。
问题描述
我只是在使用 stringdist_join() 进行左连接并且遇到了麻烦,因为我的输出比我原来的“左”数据框有更多的行。
nrow(records_nona)
#output : 603
nrow(institutions)
# output : 981
records_nona <- stringdist_left_join(records_nona, institutions,
by = c("tm_1_undergradu" = "Institution.Name"))
nrow(records_nona)
# output: 635
我不确定,为了让这成为可能,我可能会在这里搞砸什么。或者我对左连接的理解是错误的。任何指导将不胜感激,谢谢。
解决方案
我能够找出解决方案,由于连接的近似,左连接产生了重复,所以我只需要减少 max_dist = 1。(默认值为 max_dist = 2)。我现在有了正确的行数。
推荐阅读
- c# - asp.net | 如何将数据添加到数据库的下一个 ID?
- network-programming - 不必要的网络命令
- sql-server - 全文索引不适用于单个单词?
- python - 我想将“文件名”作为参数传递给其他函数调用,但总是返回“无”作为值
- rest - 如何在 Visual Basic 6 (vb6) 中使用 TLS 1.2 - REST
- python - 工作线程阻塞 GUI 中的 QTimer
- android - Kotlin 中改造回调的自定义实现
- javascript - Jquery Ajax - 在 ajax 回调函数中使用事件
- python - 如何在 tkinter 中使用 .get()?
- vba - 隐藏带循环的工作表时保持多张工作表可见