首页 > 解决方案 > 使用 SGDclassifier 的 predict_proba 进行多类分类的多类分类置信度得分

问题描述

我在 SGDClassifier 中使用逻辑回归来执行 ~10k 类别的多类分类。为了获得预测结果的置信度分数,我使用了 predict_proba 函数。但是对于正确和错误的预测,我得到的预测概率值为 0.00026091,0.00049697,0.00019632。

请提出标准化分数的方法,以便我可以通过过滤概率值来考虑结果

标签: probabilitylogistic-regressionpredictionmulticlass-classificationsgd

解决方案


如果所有类别的概率值都非常低,则可能意味着您的分类器很难对样本进行分类。您可能想做一些特征工程或尝试其他模型。要标准化这些值,请查看 scikit-learn MinMaxScaler。这会将数据缩放到 0 到 1 之间的数字。但正如我所说,如果所有值的概率都非常低,那么您将不会得到好的分类结果。希望有帮助


推荐阅读