python - 如何使用决策树进行生存分析?
问题描述
我在理解和在 Python 中应用决策树进行生存分析时遇到问题。我有一个数据集,其中包含变量年龄、体重、肿瘤大小、体积……(所有浮点数),我想知道是否与总体存活率相关(也是浮点数)。
但是我该如何应用决策树呢?在文献中,我只看到了 y_train 必须是分类变量(例如 0 或 1,良性或恶性,...)的示例,但它不适用于浮点数等连续变量。
但是,我想创建一个决策树,以便最终您可以发现肿瘤大小 > xx 且体积 > yy,您的预测总生存期约为 < zzz。
有人可以帮我解决我的问题吗?有谁知道在哪里可以阅读有关此主题的更多信息?
解决方案
Scikit-survival 包提供了一些集成决策树模型,如RandomSurvivalForest以及 Cox 模型CoxPhSurvivalAnalysis等经典模型。
文档提供了一个很好的代码示例。关于目标变量y
,至少在这种情况下,文档说明
y – 一个结构化数组,包含二进制事件指示符作为第一个字段,事件时间或审查时间作为第二个字段。
推荐阅读
- php - 需要从文件夹中检索上传的图像并将图像作为表单数据发送到 api
- html - 用于将非 ascii 字符转换为 HTML 数字代码的 Windows(命令行)工具
- ios - Swift FontAwesome 5 Pro 图标不以编程方式显示
- javascript - 嗨,我必须通过粘性导航栏从 javascript 到 typescript 传递一些代码
- javascript - 在 React 中为数字时钟创建边框
- c++ - 如何使用 C++ 套接字在逻辑数据包之间发送数据包断路器(BOOKMARK)?
- r - R中的3个变量与ggplot2的图表
- java - 带有弹簧靴而不是标准方案的 Graphql
- angular-reactive-forms - 如何添加多个字段,即基于使用角度表单控件选择的下拉选项的表单组/表单数组
- jsf - javax.el.PropertyNotFoundException:目标不可达,标识符“IndexBacking”解析为空