首页 > 解决方案 > 在 R 中重新定义回归分析的数据框

问题描述

我有一个数据框,其中包含从 a 到 b 的几次运输的时间戳以及有关材料的信息(体积、重量等)。

我使用的excel表的图片

我重新创建了我使用的原始 Excel 表的重要部分。

我的第一步是通过简单地减去日期来计算所需的时间,因为我只需要每天的精度。我把所有时间都放在一个数字向量中,以便进一步计算和绘图。

但是:我想对其进行回归分析。我知道如何创建一个lm。我的问题是,由于有几个 NA,我的“运输天数”数值向量比我在 df 中的 cols 短。如何将 df 中的 cols 与我的数值向量合并,以便传输时间再次匹配几种材料?

标签: rdataframemissing-data

解决方案


你在寻找类似的东西吗

library(dplyr)
df %>% 
  mutate(diff = as.numeric(t4-t1))

然后,您有一个时差列,而该列仍在 df 中。无论如何,您都可以告诉lm()如何处理 NA,因此您不需要删除它们(我也不认为您无论如何都在这样做)。


推荐阅读