survival-analysis - 为什么考克斯模型高估了人群的风险？

问题描述

我对 survfit 对象返回的生存概率 ($surv) 的使用有疑问。

我建立了一个 coxph 模型，然后使用它通过 survfit() 计算建模数据的每个时间窗口（在我的例子中是一个月）内的预期事件数。具体来说，对于每条记录，我将其在时间窗口 T 内的事件概率计算为 $surv[T-1] - $surv[T]; 最后，我将每个时间窗口的各个概率加在一起作为每个时间窗口内的预期事件数。

使用这种方法，我发现 coxph 模型高估了总体水平的风险（事件概率）。例如，在建模数据中，前六个月事件的实际总体累积概率为 0.167，但我使用上述方法预测得到 0.194；前 12 个月是 0.296 对 0.334，24 个月是 0.466 对 0.529。我知道该模型不会完美，但仍然对建模数据本身存在如此大的差距感到惊讶。

我用于计算的方法有什么问题吗？如果没有，你知道如何解决过度预测吗？

标签： survival-analysiscox-regressionsurvival

survival-analysis - 为什么考克斯模型高估了人群的风险？

问题描述

解决方案

推荐阅读