首页 > 解决方案 > sklearn 树可视化中的这些列表是什么

问题描述

我正在使用 sklearn.tree.export_graphviz 来可视化决策树。

https://scikit-learn.org/stable/modules/generated/sklearn.tree.export_graphviz.html

节点中都有这些列表列表,我一生都无法弄清楚它们是什么或如何摆脱它们。首先,我认为它们必须是样本。但是所有列表的大小都相同,并且样本不能表示为长度为 2 的列表。然后我认为它们要么是类名的表示,要么是杂质的表示,但我已经禁用了两者都没有效果。我还禁用了 ID、标签和杂质。这是一个多类多标签文本分类。

这是树代码:

def _create_classifier():
    decision_tree_classifier = DecisionTreeClassifier(
    criterion=CRITERION, # Gini
    splitter=SPLITTER,   # best
    min_samples_split=MIN_SAMPLES_SPLIT, # 4
    #max_features=MAX_FEATURES, # 50%
    max_depth=MAX_DEPTH, # 68
    presort=PRESORT # True
    )
return decision_tree_classifier

这是火车和出口。注意所有设置为 False:

classifier.fit(X_train, y_train)

from sklearn.tree import export_graphviz
import os

path = 'dtree.dot'

with open(path, 'w') as dotfile:
     export_graphviz(classifier, out_file = dotfile, feature_names=all_features, filled=True, rounded=True, label=False, class_names=False, node_ids=False, impurity=False, proportion=True)
    print("EXPORTED")
os.system('dot -Tpng dtree.dot -o tree.png')

这是我的树:

在此处输入图像描述

标签: pythonscikit-learngraphvizdecision-tree

解决方案


找到了。它是样品。表示是 PCA 降维的前两个组成部分。

https://scikit-learn.org/stable/auto_examples/plot_multilabel.html


推荐阅读