首页 > 解决方案 > Fit() 方法,python 中的 sklearn

问题描述

我是 sklearn 的新手,有人可以向我解释为什么在线性回归的拟合方法中,预测变量 (X) 的编码如下:

X = df[['highway-mpg']]

并且响应变量以这种形式编码:

Y = df['price']

当我必须使用带有双括号和单括号的 df 时,我有点困惑,有人可以向我解释一下吗,我试图通过 fit 方法中的文档 od sklearn 来理解,但我更加困惑。

标签: pythonscikit-learn

解决方案


双括号:它们用于从 DataFrame 中选择多列,结果是 DataFrame,它是一个 2D 数组。

单括号:它们用于从 DataFrame 中选择一列,结果是一个 Series,它是一个一维数组。

根据Sci-kit 文档,在 LinearRegression 的拟合方法中,X 的形状应为 (n_samples, n_features),为此,我们使用双括号。


推荐阅读