probability - 使用 SGDclassifier 的 predict_proba 进行多类分类的多类分类置信度得分
问题描述
我在 SGDClassifier 中使用逻辑回归来执行 ~10k 类别的多类分类。为了获得预测结果的置信度分数,我使用了 predict_proba 函数。但是对于正确和错误的预测,我得到的预测概率值为 0.00026091,0.00049697,0.00019632。
请提出标准化分数的方法,以便我可以通过过滤概率值来考虑结果
解决方案
如果所有类别的概率值都非常低,则可能意味着您的分类器很难对样本进行分类。您可能想做一些特征工程或尝试其他模型。要标准化这些值,请查看 scikit-learn MinMaxScaler。这会将数据缩放到 0 到 1 之间的数字。但正如我所说,如果所有值的概率都非常低,那么您将不会得到好的分类结果。希望有帮助
推荐阅读
- javascript - 如何确保在文件系统终止写入流之后出现 Express 响应?
- python - 如何按顺序循环/解析表行而不跳到变量的下一个实例?
- java - 已解决:选择方式链接文本不工作尝试了一切
- javascript - 何时在构造函数(道具)上使用普通状态?
- asp.net-mvc - Azure 是否曾经在应用服务中缓存旧版本的视图?
- sql - 索引列上的非常慢的不同查询
- xamarin - 你如何请求 iOS 的权限?
- javascript - 命名和未命名匿名 Javascript 函数之间的区别
- regex - VBScript 正则表达式 - 匹配多个
- c# - 将参数从视图发送回控制器以下载文件