首页 > 解决方案 > Python RandomForest 分类器(如何测试它)

问题描述

我已经能够在数据集上创建一个 RandomForestClassifier。

clf = RandomForestClassifier(n_estimators=100, random_state = 101)   

然后我可以像这样在测试数据上使用它:

prediction = pd.DataFrame(clf.predict(x)) # x = Matrix of predictor values 

所以我的问题是,如何在 Python 之外测试 clf.predict,如何查看正在使用的值以及如何“手动”测试它,例如,如果您在回归中获得 beta,则可以使用这些值在 Excel 中并复制模型。如何在 Python 中使用 RandomForests 做到这一点?

还有与 Rsquared 类似的指标来测试模型的解释能力吗?

谢谢!

标签: pythonscikit-learnrandom-forest

解决方案


是树的RandomForestClassifier集合,这意味着它由多棵树组成。

为了能够测试我建议在 Python 本身中执行的树,您可以访问分类器属性中的所有树,然后使用from模块estimators_将它们导出为图形。export_graphvizsklearn.tree

如果您坚持导出树,则需要导出构成每棵树的所有规则。为此,您可以按照sklearn文档中的说明进行操作。

关于指标,对于分类问题,您可以accuracy_scoresklearn.metrics模块中使用。


推荐阅读