首页 > 解决方案 > R中逻辑回归的重要变量

问题描述

我还是 R 新手,还在苦苦挣扎。我正在尝试使用分类和连续变量进行逻辑回归,并且应该为我的模型选择正确的变量。有 27 个变量和 8,000 个观测值。

我在网上浏览了几篇文章,包括 AIC 的逐步回归,我所做的只是让自己更加困惑。我还被告知要从相关矩阵中选择我的变量,但是当我进行相关时,我似乎没有找到相关性,尤其是与分类变量的相关性。我还尝试拟合所有模型,并得到一些 p 值小于 0.5 的变量。这是代码:

d4 <- d3[,c('SW','MOI','YOI','DOI_CMC','RMOB','RYOB','RDOB_CMC',
            'RCA','Region','TPR','DPR','NV','HEL','Has_Radio','Has_TV',
            'Religion','WI','MOFB','YOB','DOB_CMC','DOFB_CMC','AOR','MTFBI',
            'DSOUOM_CMC','RW','RH','RBMI')]
cor(d4)
d5 <- cor(d4)
round(cor(d4),2)

当我选择重要变量并尝试应用逻辑回归时,所有 p 值都将介于 0.9 到 1 之间。请参阅代码:

d3 <- lm(TPR ~ SW + MOI + RMOB + RYOB + RCA + Region + TPR + DPR +
               NV + HEL + Has_Radio + Has_TV + Religion + WI + MOFB +
               YOB + DOB_CMC + DOFB_CMC + AOR + MTFBI + DSOUOM_CMC + 
               RW + RH + RBMI,
         data = d3, family = "binomial") 
summary(d3) 

我需要这方面的帮助!!这是d3的样本 d3 样品

标签: rmodel

解决方案


推荐阅读