首页 > 解决方案 > 我应该在测试集和训练集中获得相同的准确度吗

问题描述

我是机器学习的新手,我已经建立了一个模型来预测客户是否会在下个月订阅。我在训练集上得到 73.4,在测试集上得到 72.8。可以吗?还是我有过度拟合?

标签: machine-learning

解决方案


我们称之为过拟合,如果训练数据的准确率异常高(大于95%)而测试数据的准确率非常低(小于65%)。在您的情况下,训练和测试的准确性几乎相似。所以没有过拟合。尝试更多的测试数据并检查准确性是否降低。您也可以尝试通过以下方式改进模型

  1. 尝试不同的算法
  2. 增加训练数据的大小
  3. 尝试 K 折交叉验证
  4. 超参数调优
  5. 使用正则化方法
  6. 标准化特征变量

推荐阅读