首页 > 解决方案 > 数据集中子集的线性回归模型?

问题描述

我有一个数据集,其中包含 300 多个不同车型、一些汽车、一些自行车和 10 多行特征(颜色、大小、mpg 等)的条目。

如果汽车/自行车实际上没有在数据集中分类(尽管它是有序的,即仅列 1:200是汽车,201:300 是自行车)。

我认为我需要创建我的数据集的一个子集,但我无法弄清楚如何将原始数据集中的特征与子集相关联。

抱歉,如果这解释得不好,感谢任何帮助!

标签: rmodelregression

解决方案


我认为您应该首先重组您的数据框(您可能希望在行中查看车辆模型,在列中查看特征。我建议使用t()作为转置函数,然后添加另一个带有虚拟变量的列(如果汽车类型是汽车,则为 1,如果不是,则为 0)。现在,glm()如果要拟合逻辑回归或lm()线性回归,您可以使用 mpg 回归汽车类型。


推荐阅读