machine-learning - 哪种监督机器学习分类方法适合随机分布的类?
问题描述
如果类是随机分布的或者它有更多的噪声,那么哪种类型的监督机器学习分类模型会给出更好的结果,为什么?
解决方案
很难说哪个分类器在一般问题上表现最好。它通常需要针对给定问题测试各种算法,以确定哪个分类器表现最佳。
最佳性能还取决于问题的性质。这个 stackoverflow 问题有一个很好的答案,它着眼于各种评分指标。对于每个问题,都需要了解并考虑哪种评分指标是最好的。
综上所述,神经网络、随机森林分类器、支持向量机和其他各种都是创建有用模型的候选者,因为正如您所指出的,类是均匀分布的。当类不平衡时,规则会略有变化,因为大多数 ML 算法都假设平衡。
我的建议是尝试几种不同的算法,并调整超参数,以便针对您的特定应用进行比较。你会经常发现一种算法更好,但不是特别好。根据我的经验,通常更重要的是如何预处理数据以及如何准备特征。这又是一个非常通用的答案,因为它在很大程度上取决于您给定的应用程序。
推荐阅读
- pandas - Pandas DataFrame to Dict,以(行,列)元组作为键,将这些位置的 int 值作为值
- node.js - 使用 Async 函数在 ejs 视图中打印值 Express js
- android - Android 集成测试:使用 Dagger 和 Mockito 在活动中模拟逻辑/方法,并在测试中获取返回值
- javascript - 如何给每个单元格随机数字
- pip - 在 Synology DiskStation 上安装 python 包
- powershell - 如何使用 Send-MailMessage 格式化电子邮件中 PowerShell 脚本的 Select Name、LastWriteTime 的输出?
- regex - 正则表达式匹配不包含多个句子的内容,包括换行符
- laravel - 存储下拉选项 Laravel 5.7 中的两个值
- selenium - 无法在 IE 中单击 iframe 内的元素
- css - How to apply multiple transforms to the same element