python - sklean.model_selection.StratifiedShuffleSplit 中的 n_splits 的目的是什么?
问题描述
我最近开始使用 sklearn 并偶然发现了 Stratified
ShuffleSplit 函数。即使我了解它的概念以及它的用途,我也不太了解它需要运行的参数,例如n_split。根据 sklearn 的文档,它写道
n_splits : int, 默认 10 重新洗牌和分裂迭代的次数。
我最好的猜测是它告诉StratifieShufflesplit函数数据中 starta 的数量。
解决方案
n_splits
是几乎每个交叉验证器的参数。一般来说,它决定了您将创建多少个不同的验证(和训练)集。如果您使用StratifiedShuffleSplit
它并不表示层数 - 这些是从数据集中分类目标的潜在相对频率中隐含的。
请参阅下面来自官方文档的引用(此处为完整链接)
分层洗牌拆分
StratifiedShuffleSplit 是 ShuffleSplit 的变体,它返回分层拆分,即通过为每个目标类保留与完整集合中相同的百分比来创建拆分。
推荐阅读
- java - 如何使用反射在 Enum 类上调用方法
- sql - .NET 对象: System.Data.SqlClient.SqlConnection 。NAV 服务器不支持客户端回调
- sql - 在 SQL 查询中使用字符串(表中的多值字段)作为 where 子句
- java - 在 DynamicJasper 中合并多个单元格
- php - URL 与 PHP $_SERVER['DOCUMENT_ROOT'] 不同
- mybatis - MyBatis 多行 INSERT 使用 SQL Builder
- openfire - Ofmeet 基于插件令牌的身份验证在 openfire 中不起作用
- html - 我怎样才能操纵我的标签的位置,让它们在我想要的地方
- 标签?
- node.js - 快速会话无法设置未定义的属性用户
- c# - 如何将 DataGridView 从 UserControl 访问到另一个 UserControl