python - Python在多元线性回归中选择变量
问题描述
我有一个因变量 y 和 6 个自变量。我想对其进行线性回归。我使用 sklearn 库来做到这一点。
问题是我的一些自变量的相关性超过 0.5。所以我不能同时在我的模型中使用它们
我搜索了 throw 互联网,但没有找到任何解决方案来选择最佳自变量集来绘制线性回归并输出已选择的变量。
解决方案
如果您发现自变量之间存在相关性。您应该考虑删除它们。
我看到你正在使用 scikit-learn。如果您不想手动进行任何特征选择,您始终可以使用 scikit-learns feature_selection 模块中的一种特征选择方法。有很多方法可以自动删除功能,您应该交叉验证以确定哪一种最适合您的问题。
推荐阅读
- pandas - Series.replace 不能使用类似 dict 的 to_replace 和非 None 值
- android - 进阶 Android 概念
- php - 如何在 with() 关系中与 WhereHas 等父数据进行比较
- c - 从 C 程序调用 x86 汇编函数时出现分段错误
- javascript - 如何将饼图中的图例作为 HighCharts 中的数据标签
- javascript - 从他们的消息中检查成员角色
- javascript - 打字稿不同的接口取决于函数参数
- java - 使用 vlcj 的 RTSP 音频流播放速度
- filter - 过滤器如何将另一个过滤器的结果与逻辑 AND 组合?
- office-js - 内容被阻止,因为它没有被 Outlook 插件中的有效安全证书错误签名