machine-learning - 机器学习测试数据
问题描述
我是机器学习的新手,这可能是一个愚蠢的问题。
我已经实现了我的模型及其工作。我有一个关于在测试数据上运行它的问题。这是一个二元分类问题。如果我知道测试数据中类的比例,我如何使用它来改进我的模型或改进模型所做的预测?因此,假设 75% 属于 1 类,25% 属于 0 类测试数据。
非常感谢任何帮助谢谢
解决方案
嗯,第一件事是你的数据应该是平衡的。通常在机器学习问题范式中,测试数据被视为你一无所知的东西。通过使用一些保留的数据集来改进模型的任何类型的信息都是由验证数据集完成的。寻找验证数据集。为什么需要验证数据集,数据集的平衡。这些条款将帮助您进一步进行。
推荐阅读
- c# - 将 BackgroundWorker 转换为 Task,最佳实践?
- javascript - 获取表格中 td 的值
- statistics - Octave中求解算法多项式回归,最小二乘法的问题
- google-apps-script - 如何使用 Google App Script 在 Google 电子表格中获取 E 列的最后一行
- c# - Asp.net API 未出现
- java - .DefaultHandlerExceptionResolver 我在上传数据时遇到这个错误请帮助我在这个项目中它在服务器上正常工作
- java - spring webclient 编解码器 customcodecs gsondecoder
- python - 从列和数据框迭代条件到列表转换(熊猫)
- java - 在 LinkedHashSet 中查找唯一值的索引
- visual-studio-2010 - 通过命令在 Visual Studio 中以特定行号打开 .c 文件