scikit-learn - 对每个目标使用不同的测试/训练拆分
问题描述
我计划使用包含 3 个感兴趣的目标值的数据集。最终,我将在二元目标上尝试分类方法,并计划对两个独立的连续目标使用回归方法。
对每个目标变量进行不同的训练/测试拆分是一种不好的做法吗?
否则,我不确定如何以允许我分别预测每个目标的方式拆分数据。
解决方案
如果它们实际上是分别训练和评估的 3 个不同模型,那么为了科学地评估每个模型的性能,是否对每个模型使用不同的测试训练拆分并不重要,因为模型之间不会泄漏任何信息。但是,如果您计划比较 3 个模型的结果或将所有 3 个分数组合成某个聚合指标,那么您可能希望使用相同的测试训练拆分,以便所有 3 个模型都使用相同的训练数据,否则性能每个模型的分数可能在某种程度上取决于其他模型的测试数据,因此您的综合分数在某种程度上将是您的测试数据的函数。
推荐阅读
- javascript - 尝试将对象传递给客户端站点时出现了一些意外字符
- amazon-web-services - 编写 python 脚本来创建 EC2 实例并需要建议
- r - 如果我在同一行上连续单击两次,表中的操作按钮没有响应
- bash - 在 Jenkins 管道脚本中运行时,Bash 条件失败
- r - Rmarkdown 渲染为使用 gganimate 的 pdf
- python - 为凯撒密码构建字典
- python - 如何在深度学习中为脑电图应用实现分类问题?
- hosting - 在没有 cPanel 的情况下将文件上传到 GoDaddy 网络主机?
- python - 比较 Python 中子列表的索引位置
- ios - 在 SwiftUI 中将 @Binding 变量从协议 var 传递给 if