scikit-learn - 调整特定树节点的树参数
问题描述
我DecisionTreeClassifier
从sklearn
我需要更正min_samples_leaf
特定树节点中使用的拆分器(功能)。
我该怎么做?
解决方案
您不能min_samples_leaf
为单个节点定义 ,因为模型最终分配给其他节点的样本可能少于min_samples_leaf
整个模型的样本,以确保符合适用于该单个节点的规则。
如果您正在处理不平衡的数据集,我建议您在输入模型之前对数据进行过采样或欠采样,或者您可以手动设置类权重。
在训练之前平衡你的数据集,以防止树偏向于占主导地位的类。类平衡可以通过从每个类中采样相同数量的样本来完成,或者最好通过将每个类的样本权重(sample_weight)之和归一化为相同的值来完成。
推荐阅读
- javascript - toExpontial 在本机反应中未定义
- c# - ffmpeg 可能存在 sws_scale 内存泄漏
- range - how to use the evaluation function with determined last row in VBA
- python - numpy 布尔数组中每列至少有一个 True 值
- rust - 如何使用 Clap 指定布尔命令行标志?
- markdown - 如何在不编写中间 HTML 文件的情况下将 Markdown 转换为 PDF?
- haskell - Haskell 图中是否有容器类型?
- sql - 休息后重置 ROW_NUMBER()
- sql - 如果内部联接查询不存在,则 SQLite 选择查询
- python - 能够使用 POSTMAN 访问端点,但不能使用 PYTHON