首页 > 解决方案 > python - 如何在没有python中的train_test_split函数的情况下将数据中的固定行数拆分为Xtest、Xtrain、Ytrain和Ytest

问题描述

我有 80 列的数据集。在 python 中,我想将数据分成前 60 个作为训练数据,第 13 个作为测试数据。如果我使用 train_test_split 函数,数据会随机拆分。我不想要火车的随机数据。

例如:数据集列如下所示:

日期 | 依赖变量 | 独立变量_1 | 独立变量_2

train = data[:80] 
test = data[13:]

从这里如何拆分因变量和自变量。(Xtrain,Xtest,Ytrain 和 Ytest)提前致谢。

标签: pythonscikit-learnlinear-regressiontrain-test-split

解决方案


如果我使用 train_test_split 函数,数据会随机拆分。我不想要火车的随机数据。

默认情况下它是随机的,是的,但你可以让它不是随机的。

如果你调用函数做train_test_split(X, y, test_size=0.33, shuffle=False). 注意参数shuffle

拆分前是否打乱数据

您将实现不随机拆分的拆分目标。

最后,train_test_split 使用 test_size 拆分您的数据集行,因此如果您想手动执行此操作,请记住您应该拆分行而不是列,并为 X 和 y 保留相应的列。


推荐阅读