r - 如何使用 dplyr 检测面板数据中变量随时间的变化?
问题描述
我正在使用面板数据,并且年龄变量存在一些差异。对于一些受访者,他们的年龄从一年到另一岁增加或减少超过 1 岁,正如我们在下面 ID 号为 2 和 3 的受访者中看到的那样。这可能是由于数据输入问题或其他我无法自行解决的原因。
有人可以指导我如何创建一个新变量来检测年龄增加超过 1 个值或年龄从一年减少到另一岁的人,就像下面的 ID 2 和 3 中发生的那样?
id age year
1 25 2005
1 26 2006
1 27 2007
2 50 2006
2 51 2007
2 36 2008
3 25 2005
3 30 2006
structure(list(id = structure(c(1, 1, 1, 2, 2, 2, 3, 3), format.stata = "%9.0g"),
age = structure(c(25, 26, 27, 50, 51, 36, 25, 30), format.stata = "%9.0g"),
year = structure(c(2005, 2006, 2007, 2006, 2007, 2008, 2005,
2006), format.stata = "%9.0g")), row.names = c(NA, -8L), class = c("tbl_df",
"tbl", "data.frame"))
解决方案
您可以使用group_by
和lag
来检查更改。
df %>%
arrange(id, year) %>%
group_by(id) %>%
mutate(
age_change = age - lag(age),
age_bigincrease = age_change > 1,
age_decrease = age_change < 0
)
会回来
# A tibble: 8 x 6
# Groups: id [3]
id age year age_change age_bigincrease age_decrease
<dbl> <dbl> <dbl> <dbl> <lgl> <lgl>
1 1 25 2005 NA NA NA
2 1 26 2006 1 FALSE FALSE
3 1 27 2007 1 FALSE FALSE
4 2 50 2006 NA NA NA
5 2 51 2007 1 FALSE FALSE
6 2 36 2008 -15 FALSE TRUE
7 3 25 2005 NA NA NA
8 3 30 2006 5 TRUE FALSE
推荐阅读
- python - 如何将 Flask 应用程序变成 Perl 插件?
- reactjs - KendoReact Grid 标签无法显示数据
- html - 向左对齐时,iframe 溢出 div 容器
- c - 未定义对“WinMain@16”collect2.exe 的引用的错误消息:错误:ld 返回 1 退出状态
- networkx - 如何在无线传感器网络中使用遗传算法
- ruby-on-rails - 仅为 Ruby on Rails 中的站点管理员发布
- responsive-design - 寻找有关如何将自定义类添加到 Squarespace 中的部分和模块的指导?
- data-modeling - 来自多个源表的星型模式
- java - 如何使用 Python 训练的模型在 Java/Tensorflow 中添加训练 = True?
- windows - 在 Windows 中启动 Docker Desktop 时出错