首页 > 解决方案 > 在 r 中使用 inner_join 时出现重复行

问题描述

我正在尝试在 2 个数据帧之间使用 inner_join 但在连接后获得重复值。

我尝试从只有 2 条记录的原始数据框中创建 2 个子集,然后加入它们。但仍然为每个 user_ids 获取重复值。

ab1<- subset(df.age.dlx,df.age.dlx$user_id=="9218960788394762284" | df.age.dlx$user_id == "9221471567096564493")
View(ab1)


ab2 <-subset(df.gender.dlx,df.gender.dlx$user_id=="9218960788394762284" | df.gender.dlx$user_id == "9221471567096564493")
View(ab2)

ab.join<-inner_join(xyz_df,xyz1_df,by="user_id")
View(ab.join)

在此处输入图像描述

标签: rinner-join

解决方案


如果没有 reprex 数据示例,这里可能会有一些困难,但这应该可行:

library(tidyverse)

ab1 <- df.age.dlx %>%
  filter(user_id == "9218960788394762284" | user_id == "9221471567096564493")

ab2 <- df.gender.dlx %>%
  filter(user_id == "9218960788394762284" | user_id == "9221471567096564493")

ab_join <- merge(ab1, ab2, by = "user_id")

根据您希望对完整数据集执行的操作,您可以看到您将上述内容集中在一起。


推荐阅读