python - Python SkLearn Gradient Boost Classifier Sample_Weight Clarification
问题描述
使用 Python SkLearn 梯度提升分类器。我正在使用的设置是选择随机样本(随机)。对其中一个二元类(结果 = 0)使用 sample_weight 1,对另一个类(结果 = 1)使用 20。我的问题是这些权重如何以“外行术语”应用。
是不是在每次迭代中,模型都会从样本中选择 x 行作为 0 结果,选择 y 行作为 1 结果,然后 sample_weight 设置将启动并保留所有 x 但对 y (1) 结果进行过采样20倍?
在文档中,我不清楚 sample_weight > 1 是否过采样。我知道 class_weight 是不同的,不会改变数据,而是模型如何通过损失函数解释数据。另一方面,Sample_weight 是否真的通过过采样有效地改变了输入模型的数据?
谢谢
解决方案
推荐阅读
- linux - Docker 容器挂载文件未在虚拟机中更新
- python - 如何删除 BoxLayout?
- python - 如何从 Python 中的 pandas 数据框中获取 networkx 图的分支作为列表?
- python - 如果我可以使用 post 为什么要使用 put 方法
- docker - Docker Private Registry 仅适用于 HTTPS 或 HTTP 不能同时使用两者
- css - 如何使 Web 小部件样式与不同主题兼容?
- html - 如何在 HTML-CSS 中为单边添加圆角
- formatting - 如何更正eclipse中的代码格式设置?
- sniffing - 加速 scapy 执行 - 数据包嗅探
- python - Pandas Excelwriter 百分比元素的条件格式