python - 使用预定义的目标变量混合进行训练/验证拆分
问题描述
我希望能够使用用户定义的目标变量混合进行训练/验证拆分。StratifiedKFold
并StratifiedShuffleSplit
从 sklearn 中保留原始样本中的混合物。但在 kaggle 或现实生活中,我们经常有一个单独的测试样本,有时可能会有非常不同的目标混合物。
假设我们手头有一个二元分类问题,但是标记的训练样本有 0/1 目标 vvalue 的 50/50 混合,而测试没有标签,但是从一个或另一个来源我们知道这个比例相当90/10。所以问题是 sklearn 中是否有一种方法可以将原始样本与 90/10 混合拆分,其中 90/10 将是输入参数。
它不必是一个完整的 kfold CV 拆分,但至少是一个交叉验证索引生成器ala StratifiedShuffleSplit
解决方案
推荐阅读
- azure - 从 Azure VNet 内部运行命令的最佳方式是什么?
- python - 如何在 Flask 中使用后端在 React 中上传 CSV 文件
- angular - 我在 MongoDB 集合中看到数据,但 [object][object] 显示在前端
- java - Spring Data 项目中 Spring ORM 的 Session Factory
- x11 - Linux:使不可见的 xwindow 可见
- android - Android Gradle 构建有大小限制吗?
- jenkins - Jenkins Pipeline - 错误“由于早期故障而跳过阶段”
- android - 如何在底部导航中将 MapBox 地图添加到片段中 | 科特林
- c++ - 使用 `std::numeric_limits 有什么好处吗
::max()` 而不是简单的`UINT64_MAX`?(即:`std::numeric_limits<>` vs cstdint) - html - Angular 9 改变元素的属性值