首页 > 解决方案 > R中的数据框重组从宽格式到两列

问题描述

我正在研究一个有 4 列的数据集,这些列代表某个森林斑块被砍伐的时间。

其中三列代表一年,每一行代表一个月。例如,列:2015,行:1 = 2015 年 1 月

最后一列是每个站点的唯一 ID。

对于我的分析,我需要重组这些数据,使其包含 2 行、站点和剪切的日期格式。由于我们不知道我们选择每月 15 日作为代理的确切日期。

我附上了数据的照片和摘要。

在此处输入图像描述

在此处输入图像描述

我想要的最终结果是这样的

uniqueid <- c(21000, 23400, 26800)
cut <- as.Date(c('2015-1-15','2016-3-15','2017-3-15'))
stack_example <- data.frame(uniqueid, cut)

有人可以帮我重组数据,使其类似于示例输出吗?

在此处输入图像描述

非常感谢你

<<<< 为阿克伦编辑 >>>>>

 dput(head(clf))

structure(list(X2017 = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_), X2016 = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_ ), X2015 = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_), idunique = 1:6), row.names = c(NA, 6L), class = "data.frame")

标签: rdata-structurestidyversedataformat

解决方案


我们可以使用 转为长格式,pivot_longer然后使用pasteorstr_csprintf

library(dplyr)
library(tidyr)
library(stringr)
clf %>%
      pivot_longer(cols = -idunique, values_drop_na = TRUE,
           names_to = 'date', values_to = 'value') %>%
      transmute(idunique, cut = sprintf('%s-%02d-15', 
               str_remove(date, '^X'), value))
# A tibble: 1 x 2
#  idunique cut       
#     <int> <chr>     
#1        3 2017-03-15

数据

# OP's dput showed all rows NA.  So, added a value for test
clf$X2017[3] <- 3

推荐阅读