首页 > 解决方案 > 按特定变量拆分训练和测试数据

问题描述

我正在尝试使用此代码将数据拆分为训练并测试逻辑回归:

"""

from sklearn.model_selection import train_test_split

#Split the data into test and train
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3,
random_state=10)

"""

在拆分火车和测试时,我想用 issue_dt 拆分它,它是一个变量(贷款发行日期),但该变量不应用于逻辑回归,请对此进行任何输入

标签: pythonlogistic-regressiontraining-data

解决方案


您可以尝试安装 caTools 包并使用该sample.split()功能。

但是,您需要指定 Y 和要拆分的比率:

train = sample.split( iris$Species, SplitRatio = 0.7)
trainset = subset( train, train == T)
testset = subset( train, train == F)

推荐阅读