首页 > 解决方案 > 如何加入 ColumnA = (ColumnB - 1)

问题描述

我正在尝试加入两个数据框。连接的条件不是 ColumnA=ColumnB 而是 ColumnA=ColumnB*Function。使用函数合并,我不知道如何处理它

有一个例子,

df1 <- data.frame(ID=c(5,4,3,2), CASE=c("A","B","C","D"))
df2 <- data.frame(ID=c(6,5,4,3), RESULT=c("ResultA","ResultB","ResultC","ResultD"))

我想用df1$ID = df2$ID - 1之类的东西加入 df1 和 df2 ,得到结果:

df_result<- data.frame(ID_df1=c(5,4,3,2), CASE=c("A","B","C","D"), RESULT=c("Result5","Result4","Result3","Result2"))

我试图删除连接中的引号,但它不起作用:

df_result <- merge ( x = df1, y = df2, by.x = ID , by.y = ID - 1 , all.x = TRUE)

有人可以帮助我吗?:)

谢谢 !

标签: r

解决方案


tidyverse重现您的预期输出的解决方案是

library(tidyverse)
left_join(df1, df2 %>% mutate(ID = ID - 1)) %>%
    mutate(RESULT = str_replace(RESULT, "^(.+)[A-Z]$", paste0("\\1", ID)))
#Joining, by = "ID"
#  ID CASE  RESULT
#1  5    A Result5
#2  4    B Result4
#3  3    C Result3
#4  2    D Result2

说明:如果你只想合并ID一个ID - 1简单的

left_join(df1, df2 %>% mutate(ID = ID - 1))
#  ID CASE  RESULT
#1  5    A ResultA
#2  4    B ResultB
#3  3    C ResultC
#4  2    D ResultD

足够了。附加mutate项负责RESULT根据您的预期输出进行重命名。


或者一个基本的 R 选项将从

merge(df1, transform(df2, ID = ID - 1), by = "ID")
#  ID CASE  RESULT
#1  2    D ResultD
#2  3    C ResultC
#3  4    B ResultB
#4  5    A ResultA

包括重命名RESULT

transform(
    merge(df1, transform(df2, ID = ID - 1), by = "ID"),
    RESULT = paste0(substr(RESULT, 1, nchar(as.character(RESULT)) - 1), ID))
#  ID CASE  RESULT
#1  2    D Result2
#2  3    C Result3
#3  4    B Result4
#4  5    A Result5

重现您的预期输出(行顺序略有不同)。


推荐阅读