首页 > 解决方案 > 如何使用决策树进行生存分析?

问题描述

我在理解和在 Python 中应用决策树进行生存分析时遇到问题。我有一个数据集,其中包含变量年龄、体重、肿瘤大小、体积……(所有浮点数),我想知道是否与总体存活率相关(也是浮点数)。

但是我该如何应用决策树呢?在文献中,我只看到了 y_train 必须是分类变量(例如 0 或 1,良性或恶性,...)的示例,但它不适用于浮点数等连续变量。

但是,我想创建一个决策树,以便最终您可以发现肿瘤大小 > xx 且体积 > yy,您的预测总生存期约为 < zzz。

有人可以帮我解决我的问题吗?有谁知道在哪里可以阅读有关此主题的更多信息?

标签: pythonsurvival-analysisscikit-survival

解决方案


Scikit-survival 包提供了一些集成决策树模型,如RandomSurvivalForest以及 Cox 模型CoxPhSurvivalAnalysis等经典模型。

文档提供了一个很好的代码示例。关于目标变量y,至少在这种情况下,文档说明

y – 一个结构化数组,包含二进制事件指示符作为第一个字段,事件时间或审查时间作为第二个字段。


推荐阅读