machine-learning - 机器学习中对测试和验证集标签的困惑
问题描述
我对数据集的训练和验证有疑问。
我了解训练数据标签的概念,即 y_train。我不明白为什么我们的测试/验证样本也应该有标签。我假设通过为测试样本提供标签,我们在将它们通过算法之前定义它们是什么,对吗?
让我这么说吧,如果我有一个狗和猫的图片数据集,我分别标记它们 1 和 2。那么如果我想扔一张图片(狗)来测试我的模型,而我的训练数据集中没有,我为什么要给它贴标签呢?如果我将它标记为 1,那么我预先告诉它是一只狗,如果我将它标记为 2,那么它已经是一只猫了。
我可以有一个没有标签的测试/验证数据集吗?
解决方案
验证数据集用于微调模型中的参数,而测试集用于检查准确性。没有标签怎么能声称你的模型是正确的。这个概念在监督学习中是有效的,因此需要有带有测试和验证数据集的标签。
推荐阅读
- excel - 一行括号内的多余字符
- java - 按值排序映射接口
- python - 多个列表的组合
- java - Jshell如何在行尾没有分号的情况下工作
- c++ - VS 2010 dll .data 部分在 VS 2017 中更改,搜索嵌入数据
- javascript - 你能帮我用来自对象的数据预填充一个选项框吗?
- sqlite - 仅返回数字结果的情况
- unity3d - Hololens、Unity 和空间映射来引导用户到某个位置
- java - 为什么 Javas Collections 框架二分搜索使用迭代器来搜索大列表中的元素
- windows - OpenCV VideoCapture 在 Visual Studio 2017 (Windows 10) 中不起作用