r - 理解 R. 子集中的索引
问题描述
我想更好地了解 R 如何设法弄清楚我们如何对观察进行子集化,以及子集化的最佳实践是什么。这是一个工作示例:
set.seed(1)
n = 2000; p = 10
X = matrix(rnorm(n*p), n, p)
W = rbinom(n, 1, 0.5)
Y = pmax(X[,1], 0) * W + X[,2] + pmin(X[,3], 0) + rnorm(n)
X_data<-as.data.frame(X)
Y_data<-as.data.frame(Y)
W_data<-as.data.frame(W)
olsdata<-bind_cols(Y_data, X_data)
print(summary(lm(Y~V1, data=olsdata, subset = W==0)))
当 W、X 和 Y 都分别定义时,R 如何知道哪些观察值具有 W=0?
用 Y 和 X 做 W 的 bind_cols 是否更准确,然后在 df 中已经存在的变量 W 上做子集?例如:
ols<- bind_cols(Y_data, X_data, W_data) and then do the subsetting on ols$W=0?
作为第三种选择,我可以考虑在所有三个数据库中手动创建一个索引,然后做一个左联合以确保观察结果保持它们的顺序?
这三种选择中的任何一种是否被认为是最佳实践/更有效?
谢谢你。
解决方案
推荐阅读
- r - 使用成像器导入时 Jpeg 旋转不正确
- spring-boot - 服务器收到消息,但客户端的响应为空,使用 RabbitMQ RPC
- reactjs - 如何将登录服务从 Ruby 迁移到 ReactJS?
- javascript - WebRTC 通过编辑 sdp 配置在 Chrome 中强制立体声
- r - 在 R 中为每个元素创建具有唯一位置的固定宽度文件
- javascript - 删除特定 XHR 调用的缓存
- c# - ASP.NET Core 5 MVC - 错误处理无法按预期工作 - [已解决]
- python - 从 Airflow 仪表板清除运行时如何清除历史数据?
- sql - 正则表达式 sql oracle 保证订单号以标准格式输入数据库
- firebase-cloud-messaging - Flutter:FirebaseMessaging.onBackgroundMessage 永远不会在 iOS 中执行