python - 训练和验证数据集的拆分
问题描述
我需要将我的训练数据 (80-20) 拆分为验证数据,使拆分的子数据集不是随机的,但始终相同。
目前我使用这个代码
from sklearn.model_selection import train_test_split
X_train, X_val, Y_train, Y_val = train_test_split(X, Y, test_size=0.2)
但是拆分的子数据集始终是随机的,并且永远不会相同。我希望它是随机的,但是当我再次运行代码时应该存在相同的值(类似于 np.random.seed)
有没有办法做到这一点?
解决方案
train_test_split()
有random_state
论据。如果您为其分配一个整数值,则结果将始终相同:
from sklearn.model_selection import train_test_split
X_train, X_val, Y_train, Y_val = train_test_split(X, Y, test_size=0.2, random_state=1)
推荐阅读
- typo3 - TYPO3 - 嵌套网格元素
- java - 已解决 - JSONArray 在 var 中不起作用,但在 println- JSON Java AP 中起作用 -
- java - 如何将 JSONObject 转换为 java 对象
- c# - Unity Photon PUN 2 错误尝试连接
- html - excel vba从网站表中提取数据
- java - 如何在 AWS Elastic Beanstalk 上设置编码?
- sas - SAS 阵列
跳 10 - c++ - 包含复数的向量的运算符重载
- javascript - 如何在nodejs中提供文件之前保存变量
- c++ - Is it possible to pass one argument to macro and get out two?