python - sklearn 树可视化中的这些列表是什么
问题描述
我正在使用 sklearn.tree.export_graphviz 来可视化决策树。
https://scikit-learn.org/stable/modules/generated/sklearn.tree.export_graphviz.html
节点中都有这些列表列表,我一生都无法弄清楚它们是什么或如何摆脱它们。首先,我认为它们必须是样本。但是所有列表的大小都相同,并且样本不能表示为长度为 2 的列表。然后我认为它们要么是类名的表示,要么是杂质的表示,但我已经禁用了两者都没有效果。我还禁用了 ID、标签和杂质。这是一个多类多标签文本分类。
这是树代码:
def _create_classifier():
decision_tree_classifier = DecisionTreeClassifier(
criterion=CRITERION, # Gini
splitter=SPLITTER, # best
min_samples_split=MIN_SAMPLES_SPLIT, # 4
#max_features=MAX_FEATURES, # 50%
max_depth=MAX_DEPTH, # 68
presort=PRESORT # True
)
return decision_tree_classifier
这是火车和出口。注意所有设置为 False:
classifier.fit(X_train, y_train)
from sklearn.tree import export_graphviz
import os
path = 'dtree.dot'
with open(path, 'w') as dotfile:
export_graphviz(classifier, out_file = dotfile, feature_names=all_features, filled=True, rounded=True, label=False, class_names=False, node_ids=False, impurity=False, proportion=True)
print("EXPORTED")
os.system('dot -Tpng dtree.dot -o tree.png')
这是我的树:
解决方案
找到了。它是样品。表示是 PCA 降维的前两个组成部分。
https://scikit-learn.org/stable/auto_examples/plot_multilabel.html
推荐阅读
- javascript - 移除响应式网站布局中的导航栏
- azure-blob-storage - Blob 正在上传到不同的文件夹
- php - 更改数组中的某些值
- server - 使用两个适配器在一台机器上运行两个蓝牙程序
- ios - UICollectionView 不自动滚动
- r - 是否可以在没有索引信息的情况下创建 mesh3d 对象?
- ios - Xcode 12:iOS 14 小部件在模拟器中全黑。怎么修?
- scala - Play Framework:如何过滤 json 的值?
- python - 我可以在 Pytorch 中使用什么来替换 caffe 的重量填充物
- reactjs - CSS 网格,Day.js:如何创建显示当前星期日期的日历?