首页 > 解决方案 > 与生成的统计数据不一致的 Kaplan-Meier 曲线图

问题描述

我正在为 R 包 frailtypack 中提供的再入院数据绘制 Kaplan-Meier (KM) 曲线。我使用这些简单的代码按性别变量对曲线进行分层:

library(survival)
library(frailtypack)
data(readmission)
readmission
sobj<-Surv(readmission$time,readmission$event==1)
km.plot <- survfit(sobj ~readmission$sex, data = readmission)
km.plot
plot(km.plot,lty=c(1,2),lwd=2)
legend(x="bottomleft",lty=c(1,2),lwd=2, legend=c("Male","Female"))

数据是关于反复发生的事件(即受试者有多个失败时间)。“km.plot”的输出告诉我,男性和女性都有大量的审查事件时间。在此之下,我希望 KM 曲线趋于平稳到非零生存概率,但女性的生存概率为零。当我只为第一个事件时间制作情节时,我仍然得到这个,而忽略了后续的情节。

我认为我的代码可能有问题,但很难弄清楚。我非常感谢任何帮助

标签: rsurvival-analysis

解决方案


不要在回归参数之外创建 Surv 对象,并且不要在不参考数据框的情况下使用列名。在您的代码中违反这两种做法将阻止“预测”和“绘图”方法知道使用模型对象中的术语属性访问数据元素的位置。

曲线形状的问题:如果最后一个事件是死亡,那么 KM 曲线将下降到零。

请解释为什么您认为 KM 曲线对“重复事件”有意义?


推荐阅读