python-3.x - 当一个类的特征与另一个类重叠时,哪种机器学习模型效果很好?
问题描述
关于这个训练数据集图,哪个机器学习模型适合这个。由于一个类的大多数列值与另一类重叠。
解决方案
只是一个善意的提醒。Stack-overflow 是一个关于编程问题的平台。你的问题跑题了。
查看散点图,我会说使用逻辑回归已经可以取得一些结果。显然,您的数据在二维空间中并不是完全可分离的。您将遇到设计上不同于零的错误。
为了获得更好的结果,您有一些选择:
1)设计更好的功能。两个类别的样本重叠的事实表明该特征的判别力是有限的。您可以考虑找到更好的测量来表征您的样品。
2) 使用带有内核的 SVM,将您的问题映射到更高维度的空间中。样本在二维空间中不可分离的事实可以在高维空间中轻松解决。SVM 的内核(例如多项式、高斯、...)将您的点映射到一个更高的空间,该空间将数据分开。
推荐阅读
- reactjs - 在多个组件上重用相同的 React-Redux 的 useDispatch 是否有效?
- python-3.x - 在 MacO 上卸载 python3
- apache-spark - Helm /bitnami/spark - 如何将文件加载到 extraVolumeMounts?
- rtsp - 如何将(RTSP)rtp数据从流转换为jpg图像
- mysql - 获取在提到的时间段之前不存在的条目的特定日期之间的数据
- amazon-web-services - Terraform 错误“您的查询未返回任何结果”
- python - 应用于索引时,熊猫数据框的“应用”速度很慢
- python - 用新值填充到一个用零填充的固定形状的 numpy 数组
- javascript - 日历审核活动中的 Google Admin SDK
- python - 解压缩单词后重新创建图像以获取它们