首页 > 解决方案 > 是否有为逻辑预测器选择重要特征和特征交互的功能?

问题描述

我有一个数据集,其中包含二进制目标值(结果 = 0、1)和许多分类的二进制指标变量作为输入。

因此,我的数据类似于以下内容:

Game, outcome, bison, cat, dog, v_bison, v_cat, v_dog
"001",0,0,1,0,1,1,0
"002",1,1,0,0,0,0,1
"003",1,0,0,0,0,0,1

解读这个数据,在 Game = "001" 中,有一只狗与一只野牛和一只猫对立(以 v_bison 和 v_cat 为代表)。

我想建立一个逻辑模型,该模型将考虑变量之间的相互作用以及与每个单独变量的关系“强度”。尽管我的示例很简单,但我的数据集非常广泛(超过 210 个变量),这意味着需要进行预处理 ANOVA 步骤,而不是简单地创建所有交互并将其填充到逻辑模型构建中。

是否有一种方法可以在一个步骤中自动创建交叉产品并评估最有趣的值(单个和交叉产品)?我可以通过循环步骤来做到这一点,但这似乎效率很低。

标签: pythonanova

解决方案


推荐阅读