首页 > 解决方案 > 试图理解 SKLearn 回归预测数组

问题描述

我对 Python 编程非常陌生,甚至对 SKLearn 和 ML 也很陌生。所以请原谅我对这些问题的无知。

我已经开始尝试使用 SKLearn 回归模型和代码,但是在理解这个实验代码的结果时遇到了一个基本问题。

鉴于下面的代码,我试图找出 LinearRegression 模型 predict() 函数的结果,与存储在 sales_data 数组中的商品的假设每日销售数据相关。

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

sales_data = [3, 7, 2, 4, 6, 8, 5, 10, 9, 6, 4, 7, 11, 6, 3, 1, 4, 5, 8, 10, 7] # May be a much larger array in int's

x_train = []
y_train = []
x_test = []
y_test = []
X = sales_data
Y = sales_data

x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size = 0.25, train_size = 0.75, random_state = 1)

x_train = np.array(x_train)
y_train = np.array(y_train)
x_test = np.array(x_test)
y_test = np.array(y_test)

x_train = x_train.reshape(-1, 1)
x_test = x_test.reshape(-1, 1)

lregressor = LinearRegression()
lregressor.fit(x_train, y_train)
lregressor_pred = lregressor.predict(x_test) # Trying to understand what the predicted array represents to sales_data

1) 预测的数组是否代表该商品接下来几天销售的可能结果?

2)预测的数组是从最有可能的销售数字到最不可能的销售数字排序的吗?

如果以上都不是真的,请您简单地解释一下预测数组代表什么,以及如何使用它来预测未来几天的商品销售额,或者猜测下一个可能添加到 sales_data 数组的整数。

我也在 LogisticRegression 和 RandomForest 回归模型中使用了类似的代码,但仍然不了解预测结果以及如何使用它们。

非常感谢

标签: scikit-learnlinear-regression

解决方案


1) 预测的数组是否代表该商品接下来几天销售的可能结果?

不,它是 中每个样本的预测数组x_test

2)预测的数组是从最有可能的销售数字到最不可能的销售数字排序的吗?

不,它的订购顺序与订购的顺序相同x_test


推荐阅读