python - 特定数据集上的 RandomizedSearchCV
问题描述
我想针对数据集的特定部分执行随机搜索,查看结果(不使用交叉验证)。我在下面使用的解决方案似乎过拟合了,就像 adaboost 使用整个训练集,然后根据 mask_hold 测量其准确性(但它在训练时看到了它)。你知道我错过了什么吗?
mask_hold = np.array(range(1000)) #dummy value
ada = AdaBoostRegressor(DecisionTreeRegressor(max_depth=max_depth))
ada_cv = RandomizedSearchCV(ada, param_dist, n_jobs=-1, cv=[(mask_hold,mask_hold)], n_iter=20, scoring='neg_mean_absolute_error')
ada_cv.fit(X_train,Y_train)
解决方案
推荐阅读
- python - 我想找到一种简洁的方法来检查字符串是否在列表中,如果是,则返回索引
- python - 如何比较 csv 的 2 个不同列中的 2 个日期以判断第 1 列中的日期是否在第 2 列之前
- windows - 如何删除名称不正确的文件?
- c# - 带有 ADO.NET 的实体框架不更新视图
- three.js - 将视频背景与网络栏的 3D 同步的最佳方式
- apache - Perl Apache 脚本按预期从 browser-perfroms 运行会关闭正在运行的 perl 实例,但是当尝试启动新的 perl 实例时它什么也不做
- r - 无法安装“usethis”包
- c++ - 使用事件侦听器从 Google Test 宏中提取通过的测试结果
- entity-framework-core - 如何在 EF Core 5 多对多关系中添加多个有效负载属性
- java - Spring @Transactional 对服务和非服务方法的不同行为?