r - 序数逻辑回归 - 整数因变量显示每个数据点的相关性
问题描述
我目前正在尝试运行一个简单的序数逻辑回归,将具有 5 个级别的数据值与年龄和性别进行比较,并且无论我将“年龄”变量设置为数字还是整数,输出都会显示代表的每个不同年龄的相关性在数据集中,我不确定我哪里出错了。
我在下面放了一个代码示例以及输出(完整的数据集在变量'b'中,我已经缩短了所有年龄段的输出,但你应该明白了):
> sex <- as.factor(b[,"sex"])
> age <- as.numeric(b[,"age"])
Warning message:
NAs introduced by coercion
> concern_infect_me <- factor(b[,"concern_infect_me"], order = TRUE, levels =c('1', '2', '3', '4', '5'))
> class(age)
[1] "numeric"
> m <- polr(as.factor(concern_infect_me) ~ age + sex, data = b, Hess=TRUE)
> summary(m)
Call:
polr(formula = as.factor(concern_infect_me) ~ age + sex, data = b,
Hess = TRUE)
Coefficients:
Value Std. Error t value
age50 0.37683 1.03091 0.36553
age51 1.01450 0.97053 1.04530
age52 -0.53497 0.81320 -0.65786
age53 0.01081 0.79643 0.01358
age54 0.34278 0.79978 0.42860
age55 -0.64086 0.79238 -0.80878
age56 0.04494 0.83026 0.05412
age57 0.05759 0.85094 0.06768
age58 0.19373 0.81740 0.23701
age59 0.22877 0.78047 0.29311
age60 0.19694 0.76059 0.25893
age61 0.35515 0.80291 0.44233
age62 0.05052 0.77313 0.06535
... #the ages erroneously go till age90
sex -0.20434 0.09806 -2.08391
Intercepts:
Value Std. Error t value
1|2 -2.2928 0.7026 -3.2635
2|3 -0.6617 0.6981 -0.9479
3|4 0.8395 0.6987 1.2017
4|5 1.8591 0.7006 2.6537
Residual Deviance: 4194.222
AIC: 4288.222
(221 observations deleted due to missingness)
我真的不确定为什么会导致这个问题。我以年龄作为相关变量运行的任何其他类似数据集都可以作为数字或整数变量正常工作。我是 R 的相对新手,如果有任何见解,我将不胜感激,谢谢!
解决方案
推荐阅读
- .htaccess - 使用 .htaccess 将目录重定向到文件
- php - php 不检测子文件夹和文件
- git - git - 作为别名的多行函数不起作用
- r - R - 绘制简单循环的多行问题
- excel - 如何清除内容,但公式不起作用,尽管那里存在常量(VBA)
- python - 将单个列表输入项转换为字符串以与文件位置连接
- python - 如何拆分标题值并将它们转换为不同的列?
- mysql - How to go about storing unknown number of values for each user in a SQL Row
- google-cloud-platform - 如果基本身份验证已被弃用并且已在 GKE 1.19 及更高版本中删除,我如何向 k8s 提供程序 gke 进行身份验证?
- python-3.x - 如何在没有虚拟环境的情况下使用 PyQt5