首页 > 解决方案 > train_test_split 与 StratifiedShuffleSplit 中的分层参数

问题描述

在sklearn 的函数中使用stratify参数和函数有什么区别?他们不做同样的事情吗?train_test_splitStratifiedShuffleSplit

标签: scikit-learntrain-test-split

解决方案


这两个模块执行不同的操作。

train_test_split,顾名思义,用于将数据拆分为单个训练和单个测试子集,并且该stratify参数允许以分层方式执行此操作。

StratifiedShuffleSplit,另一方面,为交叉验证提供拆分;来自文档

分层 ShuffleSplit 交叉验证器

提供训练/测试索引以拆分训练/测试集中的数据。

注意复数(强调我的)。

那么,StratifiedShuffleSplitKFold我们想要确保 CV 拆分是分层的而不是替换train_test_split.


推荐阅读