首页 > 解决方案 > 如何使用二元响应变量 Y 对分类预测变量 X 的不同级别进行分组

问题描述

我正在使用逻辑回归来预测使用多个定量和分类变量的二元响应变量 Y (0/1)。在训练模型之前,我想对分类预测变量 X 的不同级别进行分组,因为它的级别太多(例如,将级别数从 12 减少到 2 或 3)。

我希望使用二元响应变量 Y 对水平进行分组,即最终的组在 Y 方面必须彼此不同。例如,如果 X 的水平被分为两组 A 和 B,那么变量 X 为 A 组水平的所有观测值的 Y=1 必须与变量 X 为 A 组水平的所有观测值的 Y=1 的比率显着不同。

什么算法可以做这样的分组?R 中有一个包吗?

我不介意算法是否需要所需数量的组作为输入。

谢谢(对不起英语)。

标签: rvariablesgroupinglevels

解决方案


推荐阅读