首页 > 解决方案 > 如何在Weka中对不同概率截止的多类数据进行分类

问题描述

Weka 设置了默认的cutoff(即50%)来区分其两个类别的数据,并且可以通过Weka 界面中的SelectThreshold 分类器轻松地在不同的cutoff 上进行分类。现在在三类数据中,Weka 选择最高的概率,比如说从 0.333、0.421、0.246 的概率中,Weka 将选择 0.421。但在此类中,无法手动选择自定义截止值。有什么方法可以让我执行这项任务,或者有人可以帮助我理解多类数据中自定义截止的概念。

两类数据的例子

inst#,    actual, predicted, error, probability distribution
 1       1:+1       1:+1         *0.814  0.186
 2       1:+1       1:+1         *1      0    
 3       1:+1       1:+1         *0.58   0.42 
 4       1:+1       2:-1      +   0.294 *0.706
 5       1:+1       1:+1         *0.796  0.204
 6       1:+1       1:+1         *0.989  0.011
 7       1:+1       2:-1      +   0.294 *0.706
 8       1:+1       1:+1         *0.814  0.186

三类数据示例

inst#,    actual, predicted, error, probability distribution
 1       1:+1       1:+1         *0.92   0.07   0.01 
 2       1:+1       1:+1         *0.97   0.03   0    
 3       1:+1        2:0      +   0.47  *0.52   0.01 
 4       1:+1       1:+1         *0.89   0.08   0.03 
 5       1:+1       1:+1         *0.643  0.338  0.02 
 6       1:+1        2:0      +   0.22  *0.73   0.05 
 7       1:+1       1:+1         *0.45   0.21   0.34 
 8       1:+1       3:-1      +   0.16   0.19  *0.65 

标签: classwekarandom-forestmulticlass-classificationmachine-learning-model

解决方案


推荐阅读