首页 > 解决方案 > 线性回归的回归分析

问题描述

我有一个回归模型,其中我的目标变量(天)定量值范围在 2 到 30 之间。我的 RMSE 是 2.5,所有其他 X 变量(名义)都是分类的,因此我对它们进行了虚拟编码。我想知道什么是 RMSE 的好值?我想在 1-1.5 甚至更小的范围内得到一些东西,但我不知道我应该怎么做才能达到同样的效果。

注意#我已经尝试过功能选择和删除功能将不那么重要。

任何想法,将不胜感激。

标签: pythonmachine-learningsklearn-pandas

解决方案


如果您的 x 值是分类的,那么将它们绑定到统一网格不一定有意义。谁说类别 A 和 B 的间距应该与 B 和 C 相同。假设它们是只会导致结果的不正确表示。

由于您选择的比例是未知数,因此您最好在可视化方面将统一的 x 网格设置为天数,然后如果给定线性关系,则查看类别在 y 比例上的位置。

如果您没有 x 和 y 的定量数据,则根本不会出现 RMS 误差。


推荐阅读