r - 合并两个数据框 - ID 的联合,值上的“ANY”
问题描述
我有两个表A
和B
,具有以下 3 列/变量:
id
:唯一的患者标识符(字符字符串)cancer
: 是否存在癌症的二元变量 (0
=no,1
=yes)hiv
: 表示是否存在 HIV 的二元变量 (0
=no,1
=yes)
这两个表可能有不同的id
's 集,但它们具有相同的 3 列。
我想要做的是合并它们,使合并的表包含以下内容:
id
:来自A
和B
(即联合)的整个唯一患者标识符集cancer
:如果1
患者有cancer=1
或。否则,包括如果丢失。A
B
0
hiv
: 一样,cancer
除了hiv
我不确定这样做的最佳方法是什么。Base R、tidyverse 或 data.table 示例都是可以接受的。
解决方案
我不知道你是否想要join
他们。我认为,对于相同的列,您可能需要附加它们:
library(tidyverse)
A %>%
bind_rows(B) %>%
group_by(id) %>%
summarise(cancer = max(cancer, na.rm = T),
hiv = max(cancer, na.rm = T) %>%
ungroup()
推荐阅读
- postgresql - 如何在一个查询中使用 knex 在 postgres 表中切换布尔值?
- python-3.x - 如何检查整数输入是否是没有 valueError 的字符串
- react-native - 使用动态生成的单元格将 TouchableHighlight 或 Touchableopacity 添加到表格行
- javascript - Firefox 在加载时总是呈现第一帧
- python - 匹配两个熊猫系列:如何从另一个系列中的一个系列中找到一个字符串元素,然后创建一个新列
- javascript - 尝试进行 api 调用但获取状态:0
- azure - 在构建中使用 Azure 构建管道日志
- applescript - 这是类型不匹配吗
- python - 如何解决此问题不支持嵌套重命名器
- javascript - 应用上下文 TypeError 时出错:无法读取 null 错误的属性“getReferences”