首页 > 解决方案 > 决策树算法建议

问题描述

我想写一个方法,它接受近 70 个参数,并根据输入返回结果。

这是我的算法的逻辑表示:

示例树

在表示中,有 7 个参数,作为树的结果,它给了我们 Y 或 N。

我怎样才能完成编写这样一个更大、更复杂的算法?哪种语言会更有效地计算这个?

标签: pythonalgorithmdecision-tree

解决方案


在机器学习术语中,您正在描述分类树

有很多很多实现分类树的机器学习库。其中许多被设计为部署在服务器上,并且已经过优化以针对构建模型进行评分 - 这是您正在尝试做的机器学习术语 - 有效。

但是,这些库通常旨在从训练数据中学习树的结构,而您希望手动构建它。要使用这种方法,您需要找到一个模型格式可以访问和“伪造”的库。我不知道该给自己推荐哪一个,在这里寻求图书馆的建议是题外话,但数据科学可能会有所帮助。

一种选择是在PMML中对树进行编码,然后将其导入可以执行 PMML 模型的平台。例如,我相信这可以在 SQL Server 和/或 Microsoft Azure 中完成。本参考资料描述了另一种部署 PMML 模型的方法。

或者,您可以生成显示所需规则的合成数据集,然后使用您喜欢的任何分类树库在该数据上训练模型。


推荐阅读