首页 > 解决方案 > sklean.model_selection.StratifiedShuffleSplit 中的 n_splits 的目的是什么?

问题描述

我最近开始使用 sklearn 并偶然发现了 Stratified

ShuffleSplit 函数。即使我了解它的概念以及它的用途,我也不太了解它需要运行的参数,例如n_split。根据 sklearn 的文档,它写道

n_splits : int, 默认 10 重新洗牌和分裂迭代的次数。

我最好的猜测是它告诉StratifieShufflesplit函数数据中 starta 的数量。

标签: pythonmachine-learningscikit-learn

解决方案


n_splits是几乎每个交叉验证器的参数。一般来说,它决定了您将创建多少个不同的验证(和训练)集。如果您使用StratifiedShuffleSplit并不表示层数 - 这些是从数据集中分类目标的潜在相对频率中隐含的。

请参阅下面来自官方文档的引用(此处为完整链接)

分层洗牌拆分

StratifiedShuffleSplit 是 ShuffleSplit 的变体,它返回分层拆分,即通过为每个目标类保留与完整集合中相同的百分比来创建拆分。


推荐阅读