首页 > 解决方案 > 使用 R 进行数据集成

问题描述

我正在尝试通过合并 R 中的两个数据集来集成数据,我想知道我是否可以使用函数merge()但我想指定在一个结果列中具有相同信息的列这是一个示例:

数据集 1: |名字 | 姓氏 | 年龄 | 眼睛颜色 |

数据集 2: |FN | 姓氏 | 年龄 | 性别 |

我想将数据集 1 和数据集 2 合并到一个数据集(数据集 3)中,并指定“FN”与“FirstName”相同,所以我希望它是一列,所以结果应该是:

数据集 3: |名字 | 姓氏 | 年龄 | 眼睛颜色 | 性别 |

标签: rmergedatasetdata-integration

解决方案


如果您想通过 FN / FirstName 合并为公共变量,您可以在一个dplyr链中执行rename并使用merge

dataset3 <- dataset2 %>% 
  rename(FirstName = FN) %>% 
  merge(dataset1, by = "FirstName")

推荐阅读