首页 > 解决方案 > autoplot.survfit 应该适用于多阶段分层吗?

问题描述


我相信我在 ggfortify 中发现了一个错误,但我想在向开发人员发送请求之前由专家运行它。这是可能的错误:
当调用 autoplot.survfit 绘制一个 survfit 对象(来自“survival”包)时,只要有多层分层就会出错。
这是一个代表:

# Package installations
# install.packages("survival")
# install.packages("ggfortify")
# install.packages("asympTest")

# Load packages
library(survival)       # Survival analysis
library(ggfortify)      # Package in question
library(asympTest)      # Contains dataset

# Load dataset
dsNames <- data(DIGdata)
dig <- DIGdata
dig$KLevelGrp <- dig$KLEVEL > 4.3

# Create survival objects
survObject <- Surv(time = dig$DWHFDAYS, event = dig$DWHF)
survCurve <- survfit.formula(survObject ~ TRTMT + KLevelGrp, data = dig)

# Reproduce bug
autoplot(survCurve)
# Error in `levels<-`(`*tmp*`, value = as.character(levels)) : 
  # factor level [3] is duplicated

这是我认为正在发生的事情:函数 autoplot.survfit 调用 fortify.survfit 来处理 survfit 对象。fortify.survfit 的第 33-34 行(来自 getS3method("fortify", "survfit") 的行号)读取:

groupIDs <- gsub(".*=", "", names(model$strata))
groupIDs <- factor(rep(groupIDs, model$strata), levels = groupIDs)

survfit.formula 函数对两个分层变量的默认分层命名为"var1=value1,var2=value2". 此gsub调用将子字符串替换"var1=value1,var2="为空字符串。这会导致地层"var1=0,var2=0""var1=1,var2=0"都减少到"0"。这会导致 groupID 的值重复,这意味着它levels不是factor.

这是预期/不受支持的行为吗?我应该提交错误报告吗?

谢谢,
凯伦

PS。改用names(survCurve$strata)冒号是一个简单的解决方法。我不是在寻找解决方案,我只是在问我是否应该向开发人员报告这个问题。

标签: rggfortify

解决方案


推荐阅读