首页 > 解决方案 > 将数据合并在一起并无意中从 R 中的数据集中丢失行

问题描述

我认为这是一个相对简单直接的问题。或者至少我希望如此。

我正在尝试将一些数据合并在一起,即数据集 A 和数据集 B。我通过两个数据集中的列将数据连接在一起。这被称为是参与者号码的列表并且被称为part_no。然而,虽然我下面的代码行将数据集 A 和 B 合并在一起,但我最终丢失了一些行,因此丢失了一些参与者。

我相对有信心(尽管不是 100% 肯定),这可能是因为虽然 part_no 列对两个数据集都是通用的,但并非所有参与者都包含在每个数据集中(即一些参与者在数据集 A 中,一些在数据集 B 中,有些是同时)。在这种情况下,我仍然希望合并继续进行,R 用 NA 或类似的东西填充任何缺失的值。

我的代码行是

merged_data = merge(DatasetA, DatasetB, by = "part_no")

谁能建议一个快速修复?

谢谢。

编辑:每个参与者都有多行。该行merged_data = merge(DatasetA, DatasetB, by = "part_no", all = TRUE)几乎完成了这项工作,但并不完全,因为合并的数据集只包含与两个原始数据集不相关的每个参与者的一行。这使我的合并数据看起来像:

Part_no     Column A    Column B    Column C
- - - - - - - - - - - - - - - - - - - - - - - 
1             boy        17          Nick
1             boy        8           Nick
1             boy        45          Nick
1             boy        5           Nick
2             girl       14          June
2             girl       32          June
2             girl       21          June
2             girl       9           June
3             boy        11          John
4             boy        30          Alan
4             boy        27          Alan
4             boy        4           Alan
4             boy        15          Alan

标签: r

解决方案


推荐阅读