首页 > 解决方案 > Weka 中的不同采样方法

问题描述

我有一个不平衡的数据集。我尝试使用不同的重采样方法来平衡它。到目前为止,我知道有三种方法可以处理采样。1. 随机抽样 2. 交叉验证 3. 自举。

我正在使用 Weka 进行数据预处理。我知道如何在 Weka 中使用交叉验证。它带有分类器,如随机森林或朴素贝叶斯或任何其他分类器。

但我没有找到随机抽样或引导程序。

我发现有监督-> 实例-> 重新采样和无监督-> 实例-> 重新采样。

我想知道两个重采样之间的区别。这篇文章不是很有帮助。我如何在 Weka 中使用 Bootstap?有什么选择吗?

标签: machine-learningbootstrap-4datasetwekaresampling

解决方案


Bootstrapping 在 Weka 中并不是真正的评估方法。

参见 Eibe 几年前在 Wekalist 邮件上的回复:

https://list.waikato.ac.nz/hyperkitty/list/wekalist@list.waikato.ac.nz/thread/WIHQM6EK5HM4J4FHOOFNKDINK2EEWYZI/


推荐阅读