r - RDA 和超参数随机搜索的过度拟合结果?
问题描述
我正在尝试使用正则化判别分析而不是传统的线性判别分析,因为我的数据显示异方差性和不相等的组大小。为了找到允许更高成功率的最佳 lambda 和 gamma 值,我使用了该caret
软件包。然而,一位同事表示,这样做意味着由于过度拟合,成功率可能会被人为夸大。据我所知,当我在 caret 包中定义 trainControl 的参数时,我定义了一个交叉验证方法,这有助于处理过度拟合。我对吗?
这是我的数据和代码的示例:
set.seed(1337)
cv_5_rand <- trainControl(method = "cv", number = 5, search = "random")
fit.rda <- train(groups ~ ., data = data, method = "rda",
trControl = cv_5_rand, tuneLength = 500)
Hp <- as.data.table(fit.rda$results)
Hp <- Hp %>% arrange (desc(Accuracy))
据我所知,当我在 caret 包中定义 trainControl 的参数时,我定义了一个交叉验证方法,这有助于处理过度拟合。我对吗?
解决方案
推荐阅读
- image - 在 IFS 上将 Base64 字符串保存为 jpg(在 RPGLE 中)
- python - Kivy 如何在按钮之间切换
- netlogo - Netlogo:我可以期待代理,但偶尔没有人
- python - 如何将按钮放置在 tkinter 的给定框架中?
- mysql - Laravel - 数据库中具有不同字段的不同用户
- tree - 给定一棵树,为每个顶点找到到其他顶点的最长路径
- google-cloud-firestore - 对 Firestore 的调用在 Shell 本地工作,但在部署到 Cloud Functions 后出现空错误
- sql - 显示表之间的关系类型
- php - 如何在 Shopware 5 中注册我的服务和组件?
- javascript - 当我在对象文字中使用 await 时程序如何运行?