weka - 使用 J48 解释 x 级别中感兴趣的划分属性的结果 (WEKA)
问题描述
我是数据挖掘和 Weka 的新手。我使用 GUI 在 Weka 中使用 J48 构建了一个分类器,其中 J48(训练集)用于五个级别的感兴趣属性。我必须评估模型的精度,但我不知道该怎么做!一些信息可能很有趣:
== Detailed Accuracy By Class ===
Precision
0.80
?
0.67
0.56
?
?
首先,我想知道“?”的含义。在精度栏中。在两个级别中使用感兴趣的属性进行探测时,我没有得到“?”。这棵树现在比分成两层时更大。我质疑这是否意味着在五个级别中获取感兴趣的属性会在分类和计算时间方面生成效率较低的树。这似乎很明显,因为当属性具有 2 个级别时,正确分类的实例的数量高达 72%。
提前感谢您,所有有趣的答案都将得到奖励!
解决方案
“我想知道精度栏中“?”的含义”
请注意,对于这些相同的类,TP 和 FP 率为 0。J48 似乎没有将您的任何观察分配给这些类。
这些班级相对较小吗?如果是这样,您可能需要考虑使用 ClassBalancer 过滤器。这将使用权重使所有类看起来大小相同。
当然,获得模型后,您需要“转换回”真实情况。这与校正物理过采样或欠采样类似。在这里查看我的答案:https ://stats.stackexchange.com/questions/211174/how-to-exact-prediction-from-over-sampled-dataundoing-oversampling/257507#257507
推荐阅读
- python - 在python中的dicts列表中交换键
- typescript - 如何制作反应变量,例如 Vue 中的 data()?Vue+打字稿
- r - 如何在R中的循环中创建子列表
- javascript - 单击单元格时检查单选按钮并更改单元格的背景
- python - Matplotlib:将渐变颜色图与列出的颜色图相结合
- python - 我需要在 SVM 的预测时间计算 hist 吗?
- reactjs - Webpack 解决 lodash 和其他模块的错误
- python - 仅返回分配了外键的对象的查询集。Django
- docker - 如何在 Docker 中保留中间容器?
- orientdb - OrientDB 无法在相同节点之间创建多条边