首页 > 解决方案 > 如何应用欠采样数据平衡,设置参数?

问题描述

我使用 H2O 库,我想应用欠采样数据平衡,设置参数 0.8。我怎样才能做到这一点?我写了这个命令:

from h2o.estimators.gbm import H2OGradientBoostingEstimator
cov_gbm = H2OGradientBoostingEstimator(balance_classes = True)

balance_classes = True使用随机参数。我想让这个参数为0.8。

我将不胜感激。谢谢。

标签: pythonh2o

解决方案


您需要再提供一个参数:class_sampling_factors. 假设有 2 个类,并且您想对第一个类进行欠采样,然后使用:

cov_gbm = H2OGradientBoostingEstimator(balance_classes = True, class_sampling_factors = [0.8, 1])

class_sampling_factors必须是浮点数列表。列表的每个元素决定了每个类的抽样因子。


推荐阅读