首页 > 解决方案 > 训练和测试数据预测

问题描述

所以我被提出了这个问题:

(a) 训练集包含 7 个协变量的 1000 个观测值,最后(第 8 列)包含连续响应变量。从协变量预测响应变量。

(b) 测试集包含 7 个协变量的另外 500 个观测值。使用您在 (a) 部分中选择的模型提供响应预测。

我不确定我是否正确执行此操作。我已经阅读了 .csv 文件并做了一些回归。这是我一直在尝试的:

    train.lm<-lm(y~., data=train)
    summary(train.lm)
    predict(train.lm, train)
    predict(train.lm, test)

我什至走在正确的轨道上吗?

任何帮助是极大的赞赏。

编辑:数据的小样本: 数据样本

标签: rtraining-datatest-data

解决方案


推荐阅读