首页 > 解决方案 > 具有非唯一测试数据的混淆矩阵级别错误

问题描述

我正在尝试使用预测数据和实际数据生成混淆矩阵。我收到一个级别不相等的错误,并且当两个变量都被读取为因素时我收到错误。当我检查级别时,我认为问题是因为测试数据具有许多重复值,因此级别数量低于预测值,而预测值都是唯一的。有没有办法强制测试数据的水平,使其等于预测?

confusionMatrix(as.factor(sale.pred),as.factor(housing.test.df$SalePrice))

sale.pred是预测值,housing.test.df$SalePrice是实际值。如前所述, sale.pred 没有重复值,因此其级别等于行数,但housing.test.df$SalePrice具有重复值,因此其级别< n数与行数相同。

标签: r

解决方案


推荐阅读