machine-learning - RandomizedSearchCV 如何决定最佳参数是什么?
问题描述
我知道实际上没有“最佳模型”,因为成为最佳模型取决于您希望获得最佳价值的评估指标。所以我的问题是,RandomizedSearchCV
用来决定哪些是最佳参数的指标是什么?
解决方案
我希望您指的是RandomizedSearchCV。这默认使用给定估计器的评分值,您可以通过更改scoring
参数来修改它。
从文档:
评分str,可调用,列表/元组或字典,默认 = 无。
单个 str(请参阅评分参数:定义模型评估规则)或可调用对象(请参阅从度量函数定义评分策略)来评估测试集上的预测。为了评估多个指标,要么给出一个(唯一的)字符串列表,要么给出一个名称作为键、可调用对象作为值的字典。
请注意,使用自定义记分器时,每个记分器应返回一个值。返回值列表/数组的度量函数可以包装到多个记分器中,每个记分器返回一个值。
有关示例,请参阅指定多个指标进行评估。 如果没有,则使用估计器的评分方法。
Sklearn 对分类器的默认评分是accuracy
,回归器的默认评分是r2 score
例如,您可以看到对于 LinearRegresssion,它是r2 score
- 请参见此处。
推荐阅读
- javascript - 为什么我的四格拼块不会每秒都从画布上掉下来?
- c++ - C++写访问冲突
- flutter - 如何有能力同时使用 Navigator.push 和 Navigator.pushNamed 颤振
- html - HTML 无法识别 css 文件并且不会导入它
- python - 百分比增加,groupby,随着时间的推移(使用 Python)
- python - 从具有概率权重的列表中生成数字列表
- swift - 将自定义对象转换为要保存在 NSUserDefauts 中的数据
- php - 将 Prestashop 1.7 中的产品目录导出到 csv 文件以在 Facebook Shop 上使用
- ssl - 无法使用 CakePHP 3.8 在 GCP 上运行迁移
- linux - CMake 3.15.5 引导程序因 g++ 9.3.0 而失败