r - 数据集中子集的线性回归模型?
问题描述
我有一个数据集,其中包含 300 多个不同车型、一些汽车、一些自行车和 10 多行特征(颜色、大小、mpg 等)的条目。
如果汽车/自行车实际上没有在数据集中分类(尽管它是有序的,即仅列 1:200是汽车,201:300 是自行车)。
我认为我需要创建我的数据集的一个子集,但我无法弄清楚如何将原始数据集中的特征与子集相关联。
抱歉,如果这解释得不好,感谢任何帮助!
解决方案
我认为您应该首先重组您的数据框(您可能希望在行中查看车辆模型,在列中查看特征。我建议使用t()
作为转置函数,然后添加另一个带有虚拟变量的列(如果汽车类型是汽车,则为 1,如果不是,则为 0)。现在,glm()
如果要拟合逻辑回归或lm()
线性回归,您可以使用 mpg 回归汽车类型。
推荐阅读
- pandas - Matplotlib - x 和 y 必须具有相同的第一维,但形状为 (37,) 和 (38,)
- css - 如何更改整个网站的默认文本颜色
- oracle - Oracle APEX 转义 -- 和 , 字符
- python - 如何创建一个用于缓慢记录的线程,以便主要作业可以继续运行(在 python 中)?
- python - 使用 for 循环循环 driver.get 所需的多个 URL
- python - 为什么“df['legal_drinker'] = df.apply(majority)”和“df['legal_drinker'] = df['age'].apply(majority)”不同?
- java - 使用 SmartyStreets 并没有任何效果
- java - File Exists() 方法查找 Eclipse Java 包中不存在的文件
- xml - 通过 Oracle 表提取 XML
- algorithm - 了解买卖股票最佳时机的简明 DP 解决方案 IV