weka - 如何修复错误训练和测试集不兼容?
问题描述
0
我有大约 7000 条记录的数据集。清除后,我对其进行了归一化和离散化操作。然后我对其应用了一个 j48 模型并将其保存到我的计算机中。现在我想在一个 500 条记录的数据集上测试这个模型。此数据集中的所有列都与原始数据集相同。但是,测试数据集中的“类”列没有任何价值。但我得到了一个错误。出于这个原因,我还对测试数据集应用了归一化和离散化操作。但我仍然得到这个错误。请注意,我在两个数据集中都指定了类属性,但再次显示此错误。
我有大约 7000 条记录的数据集。清除后,我对其进行了归一化和离散化操作。然后我对其应用了一个 j48 模型并将其保存到我的计算机中。现在我想在一个 500 条记录的数据集上测试这个模型。此数据集中的所有列都与原始数据集相同。但是,测试数据集中的“类”列没有任何价值。但我得到了一个错误。出于这个原因,我还对测试数据集应用了归一化和离散化操作。但我仍然得到这个错误。请注意,我在两个数据集中都指定了类属性,但再次显示此错误。
这是我的测试文件的截图:test.arff screenshot
这是我的火车数据集文件的屏幕截图:在此处输入图像描述
这些是错误的屏幕截图:在此处输入图像描述
解决方案
感谢您的屏幕截图。属性“代码”在训练和测试集中没有相同的值。
看起来那是一个案例标识符,因此您不会期望值相同。因此,与其将其作为名义属性,不如将其视为数字属性。
@attribute 代码数字
让我知道这是否能解决问题。
推荐阅读
- azure - 如何在流量管理器端点中添加虚拟规模集实例 IP
- c++ - c ++ cmake(将windows转换为平台独立)WinExec to execute_process
- python - 在python中汇总分组的日期时间数据
- django - 将云存储文件 url (s3/Alibaba OSS) 存储在 postgres 等关系数据库中的 Django 最佳实践
- javascript - 是否可以通过 HTML 元素中的会话从我的数据库中传递对象?
- ruby-on-rails - 将 URL 转换为 erb 中的锚标记
- ios - 在 SwiftUI 中使用来自 React Native 资源的字体
- php - Mac OSX Mojave 将 php 升级到 7.2
- python - 如何将现有的相关字段转换为 Odoo 13 中的计算字段?
- google-cloud-platform - Google Vision OCR 的置信度 - TEXT_DETECTION 模式