首页 > 解决方案 > 如何修复错误训练和测试集不兼容?

问题描述

0

我有大约 7000 条记录的数据集。清除后,我对其进行了归一化和离散化操作。然后我对其应用了一个 j48 模型并将其保存到我的计算机中。现在我想在一个 500 条记录的数据集上测试这个模型。此数据集中的所有列都与原始数据集相同。但是,测试数据集中的“类”列没有任何价值。但我得到了一个错误。出于这个原因,我还对测试数据集应用了归一化和离散化操作。但我仍然得到这个错误。请注意,我在两个数据集中都指定了类属性,但再次显示此错误。

我有大约 7000 条记录的数据集。清除后,我对其进行了归一化和离散化操作。然后我对其应用了一个 j48 模型并将其保存到我的计算机中。现在我想在一个 500 条记录的数据集上测试这个模型。此数据集中的所有列都与原始数据集相同。但是,测试数据集中的“类”列没有任何价值。但我得到了一个错误。出于这个原因,我还对测试数据集应用了归一化和离散化操作。但我仍然得到这个错误。请注意,我在两个数据集中都指定了类属性,但再次显示此错误。

这是我的测试文件的截图:test.arff screenshot

这是我的火车数据集文件的屏幕截图:在此处输入图像描述

这些是错误的屏幕截图:在此处输入图像描述

标签: wekadata-mining

解决方案


感谢您的屏幕截图。属性“代码”在训练和测试集中没有相同的值。

看起来那是一个案例标识符,因此您不会期望值相同。因此,与其将其作为名义属性,不如将其视为数字属性。

@attribute 代码数字

让我知道这是否能解决问题。


推荐阅读