首页 > 解决方案 > 特定数据集上的 RandomizedSearchCV

问题描述

我想针对数据集的特定部分执行随机搜索,查看结果(不使用交叉验证)。我在下面使用的解决方案似乎过拟合了,就像 adaboost 使用整个训练集,然后根据 mask_hold 测量其准确性(但它在训练时看到了它)。你知道我错过了什么吗?

mask_hold = np.array(range(1000)) #dummy value
ada = AdaBoostRegressor(DecisionTreeRegressor(max_depth=max_depth))
ada_cv = RandomizedSearchCV(ada, param_dist, n_jobs=-1, cv=[(mask_hold,mask_hold)], n_iter=20, scoring='neg_mean_absolute_error')
ada_cv.fit(X_train,Y_train)

标签: pythonscikit-learncross-validation

解决方案


推荐阅读