首页 > 解决方案 > 以分类变量作为因变量和混合自变量以及存在多重共线性的回归

问题描述

所以我有一家面临高流失率的公司的数据。所以我试图找出损耗所依赖的重要变量。因此,为此,我以损耗率作为因变量进行了逻辑回归。但是所有这些的 p 值都在 1 左右。(我猜这是因为多重共线性。为此,我用相关矩阵检查了多重共线性并删除了一些变量,但 p 值仍然为零。我也做了VIF 选择值小于 10 的变量,但即便如此,模型的 p 值也约为 1。)

请帮我解决一下这个。(我确实检查了分类变量是否是“因素”)在此处输入图像描述

    fit1<-glm(Attrition~Age+BusinessTravel+Distance.From.Home+Education.Field+Gender+
 Job.Satisfaction+Marital.Status+Over.Time+
Percent.Salary.Hike+Performance.Rating+Relationship.Satisfaction+
Total.Working.Years+Years.At.Company+Years.In.Current.Role+Years.Since.Last.Promotion+Years.With.Curr.Manager, family = "binomial")

标签: rregressionlogistic-regressioncategorical-data

解决方案


推荐阅读