首页 > 解决方案 > 哪种监督机器学习分类方法适合随机分布的类?

问题描述

如果类是随机分布的或者它有更多的噪声,那么哪种类型的监督机器学习分类模型会给出更好的结果,为什么?

标签: machine-learningmultilabel-classificationsupervised-learning

解决方案


很难说哪个分类器在一般问题上表现最好。它通常需要针对给定问题测试各种算法,以确定哪个分类器表现最佳。

最佳性能还取决于问题的性质。这个 stackoverflow 问题有一个很好的答案,它着眼于各种评分指标。对于每个问题,都需要了解并考虑哪种评分指标是最好的。

综上所述,神经网络、随机森林分类器、支持向量机和其他各种都是创建有用模型的候选者,因为正如您所指出的,类是均匀分布的。当类不平衡时,规则会略有变化,因为大多数 ML 算法都假设平衡。

我的建议是尝试几种不同的算法,并调整超参数,以便针对您的特定应用进行比较。你会经常发现一种算法更好,但不是特别好。根据我的经验,通常更重要的是如何预处理数据以及如何准备特征。这又是一个非常通用的答案,因为它在很大程度上取决于您给定的应用程序。


推荐阅读