首页 > 解决方案 > 机器学习测试数据

问题描述

我是机器学习的新手,这可能是一个愚蠢的问题。

我已经实现了我的模型及其工作。我有一个关于在测试数据上运行它的问题。这是一个二元分类问题。如果我知道测试数据中类的比例,我如何使用它来改进我的模型或改进模型所做的预测?因此,假设 75% 属于 1 类,25% 属于 0 类测试数据。

非常感谢任何帮助谢谢

标签: machine-learningclassification

解决方案


嗯,第一件事是你的数据应该是平衡的。通常在机器学习问题范式中,测试数据被视为你一无所知的东西。通过使用一些保留的数据集来改进模型的任何类型的信息都是由验证数据集完成的。寻找验证数据集。为什么需要验证数据集,数据集的平衡。这些条款将帮助您进一步进行。


推荐阅读