首页 > 解决方案 > 当一个类的特征与另一个类重叠时,哪种机器学习模型效果很好?

问题描述

关于这个训练数据集图,哪个机器学习模型适合这个。由于一个类的大多数列值与另一类重叠。

标签: python-3.xmachine-learning

解决方案


只是一个善意的提醒。Stack-overflow 是一个关于编程问题的平台。你的问题跑题了。

查看散点图,我会说使用逻辑回归已经可以取得一些结果。显然,您的数据在二维空间中并不是完全可分离的。您将遇到设计上不同于零的错误。

为了获得更好的结果,您有一些选择:

1)设计更好的功能。两个类别的样本重叠的事实表明该特征的判别力是有限的。您可以考虑找到更好的测量来表征您的样品。

2) 使用带有内核的 SVM,将您的问题映射到更高维度的空间中。样本在二维空间中不可分离的事实可以在高维空间中轻松解决。SVM 的内核(例如多项式、高斯、...)将您的点映射到一个更高的空间,该空间将数据分开。


推荐阅读