python - 如何应用欠采样数据平衡,设置参数?
问题描述
我使用 H2O 库,我想应用欠采样数据平衡,设置参数 0.8。我怎样才能做到这一点?我写了这个命令:
from h2o.estimators.gbm import H2OGradientBoostingEstimator
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True)
但balance_classes = True
使用随机参数。我想让这个参数为0.8。
我将不胜感激。谢谢。
解决方案
您需要再提供一个参数:class_sampling_factors
. 假设有 2 个类,并且您想对第一个类进行欠采样,然后使用:
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True, class_sampling_factors = [0.8, 1])
class_sampling_factors
必须是浮点数列表。列表的每个元素决定了每个类的抽样因子。
推荐阅读
- python - sklearn.linear_model.LogisticRegression 中的“L1_ratio”和“C”
- javascript - Javascript - 确保字符串字段包含某些字符和数字
- hibernate - 如何按 Spring data jpa 中的 json 字段排序?
- python - 如何使用for循环提取每个数据?
- sharepoint-online - 将共享点页面上的自定义字段添加到自定义内容类型中
- testing - 如何查看下载的文件名?
- c# - 从 WebAPI 调用本机方法时如何消除不必要的实例化
- gsm - SIM7600 串行端口多路复用器与 Beaglebone
- android - Fabric Plugin 是幻影
- java - @BeforeAll 和 @Transaction 不起作用 - 数据库端的更改不会回滚