首页 > 解决方案 > 在另一个变量中分组的一个变量的唯一值的频率 - R?

问题描述

极端新手问题:我有2个变量,地区ID和家庭ID,地区内有重复的家庭。我只是想找出每个地区有多少独特的家庭。

这就是我正在尝试的:

library(dplyr)

table <- data %>% group_by(region) %>% summarise(hid = unique(hid))

错误消息:错误:列hid的长度必须为 1(汇总值),而不是 142

标签: r

解决方案


这样的事情可能会让你得到你想要的:

library(tidyverse)

df <- tibble(region_id = c(1, 2, 3, 1, 2, 3),
       household_id = c("a", "b", "b", "a", "a", "b"))

df %>% 
  group_by(region_id) %>% 
  count(household_id) %>% 
  summarize(unique_households = n())

推荐阅读