首页 > 解决方案 > predict_proba 方法如何适用于 sklearn 中 DecisionTreeClassifier 中的输入样本 X?

问题描述

DecisionTreeClassifier 有一个方法 predict_proba计算输入数据点 X 的概率。如何为已经训练好的模型计算这个预测概率?

标签: machine-learningscikit-learndecision-treesupervised-learning

解决方案


预测的类概率是叶子中同一类的样本的分数。这意味着如果您的叶子包含10 x 190 x 0。标签为 1 的概率将如下10%例所示:

from sklearn.tree import DecisionTreeClassifier
import numpy as np

X = np.zeros((100, 1))
y = np.zeros((100, ))
y[-10:] = 1
dtc = DecisionTreeClassifier(max_depth=1).fit(X, y)
dtc.predict_proba([[0]])

哪个输出:

array([[0.9, 0.1]])

推荐阅读