首页 > 解决方案 > 优化 bagging 和 boosting 分类器

问题描述

我有一个数据集,可以查看一个人是否会成功获得贷款。

我正在运行一个提升算法,我的目标是尝试优化它,这里是代码:

#Boosting
JC.Boost <- boosting(Class ~. , data = JC.train, mfinal=10)
JCpred.boost <- predict.boosting(JC.Boost, newdata=JC.test)
# JCpred.boost
JCBoostpred <- prediction( JCpred.boost$prob[,2], JC.test$Class)
JCBoostperf <- performance(JCBoostpred,"tpr","fpr")
# calc auc (area under curve)
cauc = performance(cpred, "auc")
print(as.numeric(cauc@y.values))

如何优化他们的算法以使 AUC 更高?我知道这是一个愚蠢的百万美元问题,但我有点困惑从哪里开始。

我试过增加mfinal这增加了 AUC 值,但在那之后我被困住了。任何想法都会有所帮助。

PS 用于提升的代码几乎相同

标签: ralgorithmdata-analysis

解决方案


推荐阅读