首页 > 解决方案 > 组合数据集并对齐 2 个单独的时间序列

问题描述

我将两个古气候数据集组合成一个用于回归模型。每个数据集都有一个从 0-802kys 的时间整数值。

但是,其中一组在 600kyrs ( 1 )之后跳过一年。当我将所有数据放入一帧时,丢失时间的时间序列更短,与另一帧不对齐并重新启动。我所追求的是不完整的时间序列有一个 NA 值,所以我可以省略这些行。

即当 v2=601(见图1)时,我想在各个列中读取 NA、601、3.97

我的组合代码是:

df_new <- cbind(Df1$Age,
                Df2$Age,
                Df1$Benthic, 
                Df2$Deut)

标签: r

解决方案


只需合并 data.frames 就足够了,因为两者似乎都有要匹配的键。如果没有匹配的键,您只需确保创建了额外的行。

merge(Df1,Df2, all.x = T, all.y =T)

应该可能适合你。这将是一个基本的 R 解决方案。

all.x / all.y 执行以下操作:

合乎逻辑的;如果为 TRUE,那么额外的行将被添加到输出中,x 中的每一行在 y 中没有匹配的行。这些行将在那些通常用来自 y 的值填充的列中具有 NA。默认值为 FALSE,因此只有包含 x 和 y 数据的行才会包含在输出中。

有关如何合并 data.frames 的信息: 如何加入(合并)数据帧(内、外、左、右)


推荐阅读