machine-learning - Weka 中的不同采样方法
问题描述
我有一个不平衡的数据集。我尝试使用不同的重采样方法来平衡它。到目前为止,我知道有三种方法可以处理采样。1. 随机抽样 2. 交叉验证 3. 自举。
我正在使用 Weka 进行数据预处理。我知道如何在 Weka 中使用交叉验证。它带有分类器,如随机森林或朴素贝叶斯或任何其他分类器。
但我没有找到随机抽样或引导程序。
我发现有监督-> 实例-> 重新采样和无监督-> 实例-> 重新采样。
我想知道两个重采样之间的区别。这篇文章不是很有帮助。我如何在 Weka 中使用 Bootstap?有什么选择吗?
解决方案
Bootstrapping 在 Weka 中并不是真正的评估方法。
参见 Eibe 几年前在 Wekalist 邮件上的回复:
推荐阅读
- php - 将多维数组转换为字符串并推送到新数组
- linux - Linux 配置文件中注释掉的行
- python - 使用 skimage.color.rgb2lab 将 RGB 转换为 Lab
- javascript - 如何在 React-native 中实现优雅的登录?
- python - plotly.plot 不会绘制所有数据框
- javascript - 是否可以创建具有动态状态的减速器?
- angular - 选择要在 Highcharts 上显示的数据
- date - 无法从时间戳截断日期日期
- javascript - HTML5:单击时从文件加载变化的图像
- laravel - 修改重置密码链接而不修改 laravel 中的供应商文件