首页 > 解决方案 > h2o.splitFrame 是否考虑了多项分类的类别比例?

问题描述

h2o.splitFrame 是否考虑了多项分类的类别比例?例如,如果我的原始数据集有 20%、70% 和 10% 三个类,当我创建训练、有效和测试数据集时,它们的类比例会相似吗?

谢谢您的意见!

标签: h2o

解决方案


不,不是的。

它进行了最简单的随机拆分,通过“硬币翻转”逐行独立处理每一行。

想法是,由于 H2O-3 旨在处理大数据,因此有足够的样本不必担心。


推荐阅读