首页 > 解决方案 > 序数逻辑回归 - 整数因变量显示每个数据点的相关性

问题描述

我目前正在尝试运行一个简单的序数逻辑回归,将具有 5 个级别的数据值与年龄和性别进行比较,并且无论我将“年龄”变量设置为数字还是整数,输出都会显示代表的每个不同年龄的相关性在数据集中,我不确定我哪里出错了。

我在下面放了一个代码示例以及输出(完整的数据集在变量'b'中,我已经缩短了所有年龄段的输出,但你应该明白了):

> sex <- as.factor(b[,"sex"])
> age <- as.numeric(b[,"age"])
Warning message:
NAs introduced by coercion 
> concern_infect_me <- factor(b[,"concern_infect_me"], order = TRUE, levels =c('1', '2', '3', '4', '5'))
> class(age)
[1] "numeric"
> m <- polr(as.factor(concern_infect_me) ~ age + sex, data = b, Hess=TRUE)
> summary(m)
Call:
polr(formula = as.factor(concern_infect_me) ~ age + sex, data = b, 
    Hess = TRUE)

Coefficients:
         Value Std. Error  t value
age50  0.37683    1.03091  0.36553
age51  1.01450    0.97053  1.04530
age52 -0.53497    0.81320 -0.65786
age53  0.01081    0.79643  0.01358
age54  0.34278    0.79978  0.42860
age55 -0.64086    0.79238 -0.80878
age56  0.04494    0.83026  0.05412
age57  0.05759    0.85094  0.06768
age58  0.19373    0.81740  0.23701
age59  0.22877    0.78047  0.29311
age60  0.19694    0.76059  0.25893
age61  0.35515    0.80291  0.44233
age62  0.05052    0.77313  0.06535
... #the ages erroneously go till age90
sex   -0.20434    0.09806 -2.08391

Intercepts:
    Value   Std. Error t value
1|2 -2.2928  0.7026    -3.2635
2|3 -0.6617  0.6981    -0.9479
3|4  0.8395  0.6987     1.2017
4|5  1.8591  0.7006     2.6537

Residual Deviance: 4194.222 
AIC: 4288.222 
(221 observations deleted due to missingness)

我真的不确定为什么会导致这个问题。我以年龄作为相关变量运行的任何其他类似数据集都可以作为数字或整数变量正常工作。我是 R 的相对新手,如果有任何见解,我将不胜感激,谢谢!

标签: rvariables

解决方案


推荐阅读