首页 > 解决方案 > 重组数据框 R - 在一列中收集年份

问题描述

我有一个大数据框,如下所示:

地点 类型 2005年 2006年 2007年
被判刑 女性 大学 被判刑 女性 大学 被判刑 女性 大学
巴黎 1 是的 是的 是的 是的
巴黎 2 是的 是的 是的
巴黎 3 是的 是的 是的 是的 是的
马德里 1 是的 是的 是的
马德里 2 是的 是的 是的 是的
迈阿密 1 是的 是的 是的 是的 是的 是的

我想重组它,看起来像这样:

地点 类型 被判刑 女性 大学
2005年 巴黎 1 是的 是的
2005年 巴黎 2 是的 是的
2005年 巴黎 3 是的 是的
2005年 马德里 1 是的 是的
2005年 马德里 2 是的 是的
2005年 迈阿密 1 是的 是的
2006年 巴黎 1 是的 是的
2006年 巴黎 2 是的 是的
2006年 巴黎 3 是的 是的
2006年 马德里 1 是的 是的
2006年 马德里 2 是的 是的
2006年 迈阿密 3 是的 是的

请不要注意这两个表的内部有效性。这只是为了可视化。

我尝试了 R 中的收集功能,但失败了,因为它似乎每年只需要一个变量而不是三个(在我的情况下:被判刑、女性、大学)。

有什么建议么?

谢谢

标签: rdataframegather

解决方案


我尝试复制您的示例:

test <- structure(list(location = c(NA, "Paris", "Paris", "Paris", "Madrid", 
"Madrid", "Miami"), type = c(NA, 1, 2, 3, 1, 2, 1), `2005...3` = c("Sentenced", 
"Yes", "No", "No", "Yes", "No", "Yes"), `2005...4` = c("Female", 
"No", "No", "Yes", "No", "Yes", "No"), `2005...5` = c("College", 
"Yes", "No", "No", "No", "No", "Yes"), `2006...6` = c("Sentenced", 
"No", "Yes", "Yes", "No", "No", "Yes"), `2006...7` = c("Female", 
"No", "No", "No", "Yes", "Yes", "No"), `2006...8` = c("College", 
"Yes", "Yes", "Yes", "No", "No", "Yes"), `2007...9` = c("Sentenced", 
"No", "No", "Yes", "No", "Yes", "Yes"), `2007...10` = c("Female", 
"Yes", "No", "No", "Yes", "No", "No"), `2007...11` = c("College", 
"No", "Yes", "Yes", "No", "Yes", "Yes")), row.names = c(NA, -7L
 ), class = c("tbl_df", "tbl", "data.frame"))

您基本上需要合并前两行以形成标题并使用以下代码

names(test) <- paste(names(test),test[1,],sep = "_") 
test <- test[-1,]

test <- gather(test,"key","value",3:11)
test <- test %>% separate(key,c("Year","Key"),"_")      
test <- test %>% separate(Year,c("Year","Garbage"),"[.]")
test <- test %>% select(-Garbage)
test <- test %>% spread(Key,value) 

推荐阅读