首页 > 解决方案 > 调整特定树节点的树参数

问题描述

DecisionTreeClassifiersklearn

我需要更正min_samples_leaf特定树节点中使用的拆分器(功能)。

我该怎么做?

标签: scikit-learndecision-tree

解决方案


您不能min_samples_leaf为单个节点定义 ,因为模型最终分配给其他节点的样本可能少于min_samples_leaf整个模型的样本,以确保符合适用于该单个节点的规则。

如果您正在处理不平衡的数据集,我建议您在输入模型之前对数据进行过采样或欠采样,或者您可以手动设置类权重。

根据scikit-learn 的用户指南

在训练之前平衡你的数据集,以防止树偏向于占主导地位的类。类平衡可以通过从每个类中采样相同数量的样本来完成,或者最好通过将每个类的样本权重(sample_weight)之和归一化为相同的值来完成。


推荐阅读