首页 > 解决方案 > 在插入符号包中使用 createDataPartition 时出错

问题描述

我正在尝试按照指南学习如何在 R 中使用机器学习。我在网上使用了一个样本数据集,该数据集可能缺少值。

这就是我用来拆分数据的方法:

validation_index <- createDataPartition(Test$Quantity, p=0.80, list=FALSE, times = 1, "na.rm=TRUE")

我收到此错误:

Error in quantile.default(y, probs = seq(0, 1, length = groups)) :     missing values and NaN's not allowed if 'na.rm' is FALSE

我试图包括

na.rm=TRUE 

在我的代码行中,但它不能解决错误问题。

我也尝试过使用

complete.cases(Test) 

对于缺失值,但它似乎没有帮助。

我对 R 相当陌生,环顾四周寻找答案,但到目前为止还没有找到答案,但也许我没有正确理解它。你知道如何解决这个错误吗?

标签: rr-caret

解决方案


我通过将响应(因)变量从整数转换为因子来修复此错误,例如

Test$Quantity <- as.factor(Test$Quantity)

在尝试分区之前。


推荐阅读