r - 多个样本的 R 回归
问题描述
我正在使用 R
我有一个面板数据集,包含 250 个人随时间推移的约 5000 次观察结果。
我需要在差异回归中建立差异,因此我为每个人绘制一个随机观察结果并运行回归:
lm(x ~ x1 + x2 + ... , data = ddply(df,.(individual),function(x) x[sample(nrow(x),1),]))
在得到的样本上。
我需要计算n 个n
不同随机样本的回归时间并计算每个估计器的平均值。
n
有没有办法在不手动计算和平均回归的情况下有效地做到这一点?
解决方案
解决了:
我希望找到一个特定的包来执行此操作,但我构建了一个函数。例如,对于 n = 700
fun <- function(alfa){
alfa <-ddply(df,.(individual),function(x) x[sample(nrow(x),1),])
beta <- lm(x ~ x1 + x2 + ... , data = alfa )$coefficients
return(beta)
}
df.full <- replicate(700,fun(alfa))
这样就创建了一个包含 700 行的数据集,系数名称为行。我什至可以做这样的事情:
fun <- function(alfa){
alfa <-ddply(df,.(individual),function(x) x[sample(nrow(x),1),])
beta <- lm(x ~ x1 + x2 + ... , data = alfa)
gamma <- summary(beta)[["coefficients"]][,1]
return(gamma)
}
df.full <- replicate(700,fun(alfa))
将 [,1] 更改为 [,2] 我将获得标准错误。在此之后,手段的计算直接跟随。
推荐阅读
- r - 将缺失值占位符添加到数据框中,以便 geom_line 在没有观察时中断
- php - 如何在 Laravel 中使用查询 mysql concat?
- python - Tensorflow:训练预训练模型
- javascript - 如何将 CSS 文件与 HTML 文件一起发送?
- excel - 循环遍历 VBA 中的列
- html - 如何通过一个路由器链接运行两种形式?
- angular - 如何从 Angular 的 API 中获取错误消息?
- vala - vala 初学者:如何访问 DBus 属性>
- jquery - 使用 jquery 选择和设置奇数组合项目的样式
- postgresql - Oracle 的 FLOAT(126) 的 PostgreSQL 等效项是什么?