python - python - 如何在没有python中的train_test_split函数的情况下将数据中的固定行数拆分为Xtest、Xtrain、Ytrain和Ytest
问题描述
我有 80 列的数据集。在 python 中,我想将数据分成前 60 个作为训练数据,第 13 个作为测试数据。如果我使用 train_test_split 函数,数据会随机拆分。我不想要火车的随机数据。
例如:数据集列如下所示:
日期 | 依赖变量 | 独立变量_1 | 独立变量_2
train = data[:80]
test = data[13:]
从这里如何拆分因变量和自变量。(Xtrain,Xtest,Ytrain 和 Ytest)提前致谢。
解决方案
如果我使用 train_test_split 函数,数据会随机拆分。我不想要火车的随机数据。
默认情况下它是随机的,是的,但你可以让它不是随机的。
如果你调用函数做train_test_split(X, y, test_size=0.33, shuffle=False)
. 注意参数shuffle:
拆分前是否打乱数据
您将实现不随机拆分的拆分目标。
最后,train_test_split 使用 test_size 拆分您的数据集行,因此如果您想手动执行此操作,请记住您应该拆分行而不是列,并为 X 和 y 保留相应的列。
推荐阅读
- c# - 使用 LINQ 过滤列表的最佳方法是什么?
- advanced-installer - 导入 Visual Studio 项目时无法加载文件或程序集 System.Runtime.CompilerServices.Unsafe,版本 = 4.0.4.0
- c++ - 如何削减平面缓冲区矢量大小?
- angular - 登录角度后如何重定向到主页
- python - 未找到带有参数 '('',)' 的 'update_cart' 的反向操作。尝试了 1 种模式:['cart/(?P
[\\w-]+)/'] - amazon-web-services - AWS EC2 访问本地存储
- python - 基于 BERT 的 NER 模型在反序列化时给出不一致的预测
- android - 即使片段没有使用导航组件出现,也会调用片段中的 onSaveInstanceState()
- python - 在 Python Pandas 中填充缺失的数据并将行转换为列
- regex - 正则表达式格式“YYYY/NNNN”或“YYYY/NNNN/国家代码”