python - 线性回归的回归分析
问题描述
我有一个回归模型,其中我的目标变量(天)定量值范围在 2 到 30 之间。我的 RMSE 是 2.5,所有其他 X 变量(名义)都是分类的,因此我对它们进行了虚拟编码。我想知道什么是 RMSE 的好值?我想在 1-1.5 甚至更小的范围内得到一些东西,但我不知道我应该怎么做才能达到同样的效果。
注意#我已经尝试过功能选择和删除功能将不那么重要。
任何想法,将不胜感激。
解决方案
如果您的 x 值是分类的,那么将它们绑定到统一网格不一定有意义。谁说类别 A 和 B 的间距应该与 B 和 C 相同。假设它们是只会导致结果的不正确表示。
由于您选择的比例是未知数,因此您最好在可视化方面将统一的 x 网格设置为天数,然后如果给定线性关系,则查看类别在 y 比例上的位置。
如果您没有 x 和 y 的定量数据,则根本不会出现 RMS 误差。
推荐阅读
- asp.net-core - 当我想在 blazor 服务器中使用 httpclient 时出现错误
- algorithm - 解决运算符优先级的函数
- c++ - read() 没有按预期阻塞
- sql - 如何处理 PostgreSQL 中的大小写敏感问题
- mysql - 如何在 SQL 中查询单个单元格中的多个值
- arrays - 为什么Gson允许普通数组声明,然后在Map中访问它时抛出ClassCastException?
- amazon-web-services - 具有两个 IAM 角色的两个 AWS Lambda 函数
- php - 通过受保护的 SendinBlue 对象循环
- c# - ASP.NET Core 3.1 IOptions - 无法从 Helper 类中的文件初始化配置
- react-native - 如何在 expo 应用程序中使用 jest 模拟 SQLite.openDatabase?