scikit-learn - 在 GridSearchCV 中处理训练和测试集
问题描述
我想通过使用节点嵌入算法来评估不同的分类器来执行链接预测任务。更具体地说,我想评估节点嵌入是否可以提高不同分类器预测节点之间新链接的准确性。
我的想法如下:
- 我创建了一个包含正样本和负样本的数据集(真实链接和不存在的链接)
- 我在开发测试 (DS) 和评估测试 (ES) 中拆分数据集。
- 我使用 DS 执行网格搜索交叉验证 (CV) 以找到最佳模型
- 我在整个 DS 上训练最好的模型,然后在 ES 上评估它的性能。
问题如下:我不能在整个数据集上使用节点嵌入算法,因为在这种情况下,ES 将包含与原始图拓扑相关的信息。因此,我需要从 Grid Search CV 期间生成的训练和测试集中提取节点嵌入,但是如何使用sklearn.model_selection.GridSearchCV
该类来做到这一点?
解决方案
推荐阅读
- javascript - 更新服务工作者时,Service-worker.js 保留在内存变量中
- html - Angular 11:如何声明包含 Angular 组件的数组
- spring - 最佳实践:如何自定义 RestTemplate 自动重试失败的 api 调用?
- java - 无法使用 freemarker 模板为列表映射呈现表格
- c# - 如何修改在 HTTP 代理中发送的请求?
- visual-studio - Unity object.transform.position 返回低数字?
- sql - Packer 构建失败并出现 SQL 2014 .\SETUP.EXE 退出,错误代码为 -2068774911 Azure
- kotlin - 限制 Kotlin 中协程的数量
- twilio - 创建房间时如何在 Twillio 可编程视频 statusCallback 中指定 statusCallbackEvent?
- reactjs - 使用反应挂钩 setstate 将数组推送到状态不起作用