首页 > 解决方案 > 有没有办法在 Sklearn 中直接访问交叉验证中的每个折叠?

问题描述

我知道这个问题可能很奇怪。问题是我有一个项目让我只使用线性回归......而且我是一个菜鸟。这个模型的数据非常糟糕,所以在我使用 Lasso 交叉验证之前。我得到这样的 R2 分数:

[ 0.56585033  0.62250232  0.25906073  0.46078607 -0.11444177  0.52783587
  0.52068463  0.73543617  0.56687063  0.18193339]

如您所见,有一个 -0.11 和一个 0.18 非常低。我想看看他们发生了什么事。原因是即使使用套索,以下是我能得到的最好的,没有 0 和很大的差异......

[0.33662216 0.50566121 0.27028283 0.47558253 0.4023398  0.26292917
 0.48559272 0.59582206 0.53425416 0.32131172]

顺便说一句,只有 150 个观测值具有 20 个特征。这就是我使用套索的原因。

或者,我还能做些什么来使这个线性回归更好?

标签: pythonscikit-learnlinear-regressiondata-analysis

解决方案


推荐阅读