scikit-learn - 试图理解 SKLearn 回归预测数组
问题描述
我对 Python 编程非常陌生,甚至对 SKLearn 和 ML 也很陌生。所以请原谅我对这些问题的无知。
我已经开始尝试使用 SKLearn 回归模型和代码,但是在理解这个实验代码的结果时遇到了一个基本问题。
鉴于下面的代码,我试图找出 LinearRegression 模型 predict() 函数的结果,与存储在 sales_data 数组中的商品的假设每日销售数据相关。
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
sales_data = [3, 7, 2, 4, 6, 8, 5, 10, 9, 6, 4, 7, 11, 6, 3, 1, 4, 5, 8, 10, 7] # May be a much larger array in int's
x_train = []
y_train = []
x_test = []
y_test = []
X = sales_data
Y = sales_data
x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size = 0.25, train_size = 0.75, random_state = 1)
x_train = np.array(x_train)
y_train = np.array(y_train)
x_test = np.array(x_test)
y_test = np.array(y_test)
x_train = x_train.reshape(-1, 1)
x_test = x_test.reshape(-1, 1)
lregressor = LinearRegression()
lregressor.fit(x_train, y_train)
lregressor_pred = lregressor.predict(x_test) # Trying to understand what the predicted array represents to sales_data
1) 预测的数组是否代表该商品接下来几天销售的可能结果?
2)预测的数组是从最有可能的销售数字到最不可能的销售数字排序的吗?
如果以上都不是真的,请您简单地解释一下预测数组代表什么,以及如何使用它来预测未来几天的商品销售额,或者猜测下一个可能添加到 sales_data 数组的整数。
我也在 LogisticRegression 和 RandomForest 回归模型中使用了类似的代码,但仍然不了解预测结果以及如何使用它们。
非常感谢
解决方案
1) 预测的数组是否代表该商品接下来几天销售的可能结果?
不,它是 中每个样本的预测数组x_test
。
2)预测的数组是从最有可能的销售数字到最不可能的销售数字排序的吗?
不,它的订购顺序与订购的顺序相同x_test
。
推荐阅读
- angular - TypeError:无法使用玩笑读取未定义的属性“原型”
- python-3.x - 由 ProxyError('Cannot connect to proxy.', OSError('Tunnel connection failed: 407 Proxy Authentication Required')) 引起
- php - 需要创建对象
- mongodb - java.lang.NoSuchFieldError:ACKNOWLEDGED
- qt - 如何遍历树模型中的所有索引
- java - 如何使用 ExecutorService 重新启动之前在 Swing 应用程序中终止的线程
- java - 使用@Async注解限制线程数并等待最大线程数
- c# - nHibernate 事务日志记录
- gulp - Gulp 3 => Gulp 4 问题
- javascript - 如何自动播放 w3school javascript 报价幻灯片?