首页 > 解决方案 > 如何选择最适合的机器学习算法

问题描述

虽然经常运行机器学习算法,但在这种情况下,准确性正在发生变化,如何为该特定数据集选择最适合的算法。

标签: python-3.xmachine-learning

解决方案


让我们假设,每次我们通过将预测响应与我们的测试数据相关值(Y)进行比较来运行准确性时,问题都是针对相同的数据集 X(训练)。如果我们运行模型时准确性不断变化,那么问题在于采样偏差(训练和测试数据的划分是一个谜)。

当您导入 train_test_split 函数时,请明智地使用 random_state 属性来保持测试数据对整个数据群体的代表性。


推荐阅读