python - 使用 python statsmodels 计算 DFFITS 需要很长时间
问题描述
我使用 statsmodels 来计算厨师的距离和 dffits。
特征数:3,样本量:200,000
谷歌 colab,statsmodels 版本:0.10.2
model = sm.OLS(Y,sm.add_constant(X))
results = model.fit()
influence = results.get_influence()
cooks_d, p_value = influence.cooks_distance
dffits, dffits_threshold = influence.dffits
我立即得到了 cooks_d,但 dffits 需要很长时间。如果我使用summary_frame(),也需要很长时间。
sm_fr = influence.summary_frame()
有什么建议可以解决这个问题吗?
解决方案
推荐阅读
- node.js - 尝试运行“npm install ably”但遇到问题
- jquery - ASP MVC - 在部分视图中提交更新或创建操作而不加载页面
- c - 理解 C 指针、数组和负索引
- javascript - 根据元素的数据属性向元素添加类
- vba - 在以下幻灯片中隐藏形状
- node.js - 在 Electron 应用程序的生产环境中表达本地主机 URL
- delegates - 可以委托的解析器的借用检查器问题
- tomcat - Tomcat 端口已更改,但 Apache 欢迎页面仍在 8080 上显示
- angular - 使用 takeUntil 和 combineLatest 取消订阅可观察的 rxjs 不起作用
- r - 将数据框列类型设置为字符而不是因子(默认)R