python - 如何训练测试拆分和交叉验证
问题描述
我仍然对数据验证工作流程感到困惑。据我了解,当我得到一个数据集时,我将数据分成两部分,训练集和测试集,使用train_test_split
. 然后,我在训练集上执行模型选择和超参数调整cross_val_score
。cross_val_predict
然后,我在测试集上执行所选模型以查看模型性能。我理解正确吗?或者我可以在不使用的情况下对整个数据集执行cross_val_score
和cross_val_predict
train_test_split
解决方案
是的,可以使用 cross_val_score /cross_val_predict 进行模型选择和参数调整。它还允许您选择要判断模型的指标。所以你基本上是在交叉验证结果之后选择你的模型和参数,看看它是否能很好地概括测试数据和现实世界的数据。
推荐阅读
- python - 如何在 python 自动化中创建一个 DBConnectivity 实用程序类,它为整个测试套件返回/创建单个 dbconnection
- python - 我如何告诉 Python 组合一列中的每一行并返回加起来为零的行?
- ios - Xamarin Forms 软键盘的文化不正确
- python - 字符串中出现的非 ASCII 字符
- react-native - 在本机反应中同时获取单击和移动事件
- python - 如何验证 pip 的 --extra-index-url?
- javascript - 如何使用滑动检测构建触摸手势?
- excel - 如何将超链接复制到只有路径的单元格?
- chef-infra - 如何为 Seven_zip_archive 资源编写 chefspec 代码?
- sql - 在 BigQuery 中更新分区表和聚簇表