首页 > 解决方案 > 如何为日常预测建立线性回归模型

问题描述

我需要创建一个预测模型来预测每天的物品数量......

这就是我的数据在 DB 上的样子...

item id |date         | quantity

1000    |2020-02-03   | 5

我所做的是将日期转换为:

我使用 RegressionFastForest、RegressionFastTree、LbfgsPoissonRegression、FastTreeTweedie 在 100,000 个项目的数据集上训练了这个模型

但结果不是很好(RMSE SCORE OF 3.5 - 4

我做错了吗?

如果有问题,我正在使用 ML.NET

谢谢

标签: machine-learningml.net

解决方案


将线性回归直接应用于数据存在几个问题。

1)如果item id是分类索引,不反映物品的物理特性,那么它是分类特征。使用OneHotEncoding将其替换为回归友好的标签。

2) 如果您假设您的数据可能周期性地依赖于一天/周/月的时间,请使用sin这些cos函数。它不适用于年份,因为它不是周期性的。是一个很好的 Python 示例指南。

祝你好运!

PS我通常在具有分类特征(OneHotEncoding)的稀疏表示的任务中使用LogisticRegression作为基准。它不如最先进的 NN 解决方案好,但让我知道基准是什么样子的。


推荐阅读