首页 > 解决方案 > WEKA 中的有监督和无监督重采样有什么区别?

问题描述

我想知道weka.filters.supervised.instance.Resample和有什么区别weka.filters.unsupervised.instance.Resample?在哪些情况下我们应该使用每一个?

标签: javamachine-learningclassificationwekaresampling

解决方案


有监督和无监督重采样的文档是相同的,只是有监督重采样 的文档有额外的句子:

可以使过滤器保持子样本中的类分布,或使类分布偏向均匀分布。

监督重采样也有额外的参数:

-B <num>
Bias factor towards uniform class distribution.
0 = distribution in input data  
1 = uniform distribution.
(default 0)

因此,监督重采样仅适用于存在类变量的情况。当完全偏向输入分布(B=0)时,每个子样本都会复制整个数据集的类分布。B=1 等效于无监督重采样,其中点从整个总体中均匀抽取,而不考虑类别。


推荐阅读