首页 > 解决方案 > 使用 spread() 或其他整形函数使用多个度量列将数据从长整形到宽

问题描述

我知道这里已经有很多关于这个话题的问题。但是在我查看了一些之后,它们都只有一个“度量”列。我仍然无法弄清楚如何处理我的数据。

我的数据如下所示,X1,X2表示不同的区域。因此,该数据集中的每一列都代表为单个区域收集的所有年龄。

age     X1   X2
age 0   2    2
age 1   2    2 
age 2   2    3
  ... 

我想将数据重塑为宽格式:

     age 0  age 1 age 2
X1    2      2     2 
X2    2      2     3
     ...

要重新创建数据集,请使用

data <-structure(list(age = c("age 0", "age 1", "age 2", "age 3", "age 4", 
"age 5", "age 6", "age 7", "age 8", "age 9", "age 10", "age 11", 
"age 12"), X1 = c(2, 2, 2, 4, 7, 12, 19, 22, 18, 11, 6, 3, 3), 
    X2 = c(2, 2, 3, 4, 8, 14, 21, 24, 20, 12, 7, 4, 3)), row.names = c("0", 
"1", "2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12"
), class = "data.frame")

转置可以解决问题:

rownames(data)<- data[,1]
wide <- t(data)[2:3,] 

但我想知道如何使用 spread() 或其他重塑函数来做到这一点。

library(tidyr)
wide <- spread(data, age, X1)
#X2 remains the same, and X1 is not correcty reshaped.
wide <- spread(data, age, X1, X2)
#Error in spread.data.frame(data, age, X1, X2) : object 'X2' not found

标签: rreshapespread

解决方案


下面是一个 tidyr 解决方案。您需要将区域收集到单个列中才能传播它。

library(tidyr)
data %>% gather(region,val,-age) %>% spread(age,val)  

#   region age 0 age 1 age 10 age 11 age 12 age 2 age 3 age 4 age 5 age 6 age 7 age 8 age 9
# 1     X1     2     2      6      3      3     2     4     7    12    19    22    18    11
# 2     X2     2     2      7      4      3     3     4     8    14    21    24    20    12

推荐阅读