首页 > 解决方案 > Python在多元线性回归中选择变量

问题描述

我有一个因变量 y 和 6 个自变量。我想对其进行线性回归。我使用 sklearn 库来做到这一点。

问题是我的一些自变量的相关性超过 0.5。所以我不能同时在我的模型中使用它们

我搜索了 throw 互联网,但没有找到任何解决方案来选择最佳自变量集来绘制线性回归并输出已选择的变量。

标签: pythonlinear-regression

解决方案


如果您发现自变量之间存在相关性。您应该考虑删除它们。

我看到你正在使用 scikit-learn。如果您不想手动进行任何特征选择,您始终可以使用 scikit-learns feature_selection 模块中的一种特征选择方法。有很多方法可以自动删除功能,您应该交叉验证以确定哪一种最适合您的问题。


推荐阅读