首页 > 解决方案 > 获取 one-hot 编码的 H2OFrame

问题描述

我在 H2O 中使用 xgboost 进行二进制分类任务。数据集有几个分类特征,模型在训练期间对其应用单热编码。

现在我想使用 SHAP ( https://github.com/slundberg/shap ) 在本地解释预测。为此,最好让数据帧具有一次性编码的列和值。但是,我似乎无法从 H2O 模型中得到这个。

我可能可以手动重新创建一次性编码,但也许有人知道更快的解决方案?

标签: pythonmachine-learningh2oshap

解决方案


我们已经为此开放了一段时间的票,但由于对该功能的需求增加,我们将很快重新访问。现在,您必须使用该方法将 H2OFrame 转换为 Pandas DataFrame as_data_frame(),然后应用以下解决方案之一。


推荐阅读