python - Fit() 方法,python 中的 sklearn
问题描述
我是 sklearn 的新手,有人可以向我解释为什么在线性回归的拟合方法中,预测变量 (X) 的编码如下:
X = df[['highway-mpg']]
并且响应变量以这种形式编码:
Y = df['price']
当我必须使用带有双括号和单括号的 df 时,我有点困惑,有人可以向我解释一下吗,我试图通过 fit 方法中的文档 od sklearn 来理解,但我更加困惑。
解决方案
双括号:它们用于从 DataFrame 中选择多列,结果是 DataFrame,它是一个 2D 数组。
单括号:它们用于从 DataFrame 中选择一列,结果是一个 Series,它是一个一维数组。
根据Sci-kit 文档,在 LinearRegression 的拟合方法中,X 的形状应为 (n_samples, n_features),为此,我们使用双括号。
推荐阅读
- flutter - 在颤振中传递多行数据
- c# - C# 使用依赖注入的实体框架保存历史表接口
- git - 从 GIT 中检索已删除的文件
- java - Redis JsonJacksonCodec。LocalDateTime 序列化问题
- onlyoffice - ONLYOFFICE Documents for Android 的源代码在哪里?
- erlang - Erlang Erl 命令在 Windows 10 上不起作用
- cmake - Cmake 的 FetchContent 与 gRPC 问题
- sql - 选择所有员工都只是文员的部门
- css - 在 Angular 9 中自定义 CSS 文件之后加载 CKEditor CSS 文件
- microsoft-teams - 当从 MS 团队频道添加/删除成员时,应用程序有什么方法可以获取通知?