survival-analysis - 为什么考克斯模型高估了人群的风险?
问题描述
我对 survfit 对象返回的生存概率 ($surv) 的使用有疑问。
我建立了一个 coxph 模型,然后使用它通过 survfit() 计算建模数据的每个时间窗口(在我的例子中是一个月)内的预期事件数。具体来说,对于每条记录,我将其在时间窗口 T 内的事件概率计算为 $surv[T-1] - $surv[T]; 最后,我将每个时间窗口的各个概率加在一起作为每个时间窗口内的预期事件数。
使用这种方法,我发现 coxph 模型高估了总体水平的风险(事件概率)。例如,在建模数据中,前六个月事件的实际总体累积概率为 0.167,但我使用上述方法预测得到 0.194;前 12 个月是 0.296 对 0.334,24 个月是 0.466 对 0.529。我知道该模型不会完美,但仍然对建模数据本身存在如此大的差距感到惊讶。
我用于计算的方法有什么问题吗?如果没有,你知道如何解决过度预测吗?
解决方案
推荐阅读
- node.js - 如何开玩笑地调用外部函数
- android - 为什么android studio中的R下有错误?
- mongodb - 使用 mongodb 更新哈希密码
- javascript - 有没有办法在单个语句中设置日期对象的日期和月份?
- parallel-processing - 将数据从全局内存移动到共享内存是否会使线程停止?
- linux - 使用 QEMU 作为运行时/兼容性层(基本主机操作系统)
- node.js - NodeJS:fs.createReadStream 有时不会读取所需的“开始”和“结束”字节
- jquery - Laravel 7 错误 - SQLSTATE [23000]:完整性约束违规:1048 列 'first_name' 不能为空
- java - Java/Scala 同步如何影响性能?
- node.js - HEROKU : node-pre-gyp install --fallback-to-build