首页 > 解决方案 > 如何训练测试拆分和交叉验证

问题描述

我仍然对数据验证工作流程感到困惑。据我了解,当我得到一个数据集时,我将数据分成两部分,训练集和测试集,使用train_test_split. 然后,我在训练集上执行模型选择和超参数调整cross_val_scorecross_val_predict然后,我在测试集上执行所选模型以查看模型性能。我理解正确吗?或者我可以在不使用的情况下对整个数据集执行cross_val_scorecross_val_predicttrain_test_split

标签: pythonmachine-learningdata-sciencecross-validationtrain-test-split

解决方案


是的,可以使用 cross_val_score /cross_val_predict 进行模型选择和参数调整。它还允许您选择要判断模型的指标。所以你基本上是在交叉验证结果之后选择你的模型和参数,看看它是否能很好地概括测试数据和现实世界的数据。


推荐阅读