h2o - h2o.splitFrame 是否考虑了多项分类的类别比例?
问题描述
h2o.splitFrame 是否考虑了多项分类的类别比例?例如,如果我的原始数据集有 20%、70% 和 10% 三个类,当我创建训练、有效和测试数据集时,它们的类比例会相似吗?
谢谢您的意见!
解决方案
不,不是的。
它进行了最简单的随机拆分,通过“硬币翻转”逐行独立处理每一行。
想法是,由于 H2O-3 旨在处理大数据,因此有足够的样本不必担心。
推荐阅读
- pandas - Pandas:如果不是 NaN 则打印(列)
- formatting - Freemarker 格式 BigDecimal 到德语区域设置无法正常工作
- haskell - 堆栈“计划构建失败。”
- python - 使用 python 生成示例(鸢尾花)数据集
- java - sendKeys() 未通过 Selenium 和 Java 使用 WebDriverWait 插入完整值
- oracle - 如何修复“遇到以下符号之一时遇到符号“=:”plsql中的错误
- python - 为什么 pyglet.image 和 texture 这么重?
- html - 在图例标签中找不到文本
- python - 使用 saved_model 加载器从文件加载后的图形手术
- mobile - BuildContext + 小部件树