首页 > 解决方案 > 机器学习中对测试和验证集标签的困惑

问题描述

我对数据集的训练和验证有疑问。

我了解训练数据标签的概念,即 y_train。我不明白为什么我们的测试/验证样本也应该有标签。我假设通过为测试样本提供标签,我们在将它们通过算法之前定义它们是什么,对吗?

让我这么说吧,如果我有一个狗和猫的图片数据集,我分别标记它们 1 和 2。那么如果我想扔一张图片(狗)来测试我的模型,而我的训练数据集中没有,我为什么要给它贴标签呢?如果我将它标记为 1,那么我预先告诉它是一只狗,如果我将它标记为 2,那么它已经是一只猫了。

我可以有一个没有标签的测试/验证数据集吗?

标签: machine-learningdeep-learning

解决方案


验证数据集用于微调模型中的参数,而测试集用于检查准确性。没有标签怎么能声称你的模型是正确的。这个概念在监督学习中是有效的,因此需要有带有测试和验证数据集的标签。


推荐阅读