索引单独的生存曲线

Question

我想在 ggplot 中为两组中的每一组绘制 Kaplan-Meier 生存估计值。

要做到这一点，需要为每个组获取单独的生存曲线。 survival 包中的 survfit 函数很好地分割了它们，但我不知道如何索引单独的图来处理它们。

这是示例数据：

rearrest<-read.table("http://stats.idre.ucla.edu/stat/examples/alda/rearrest.csv", sep=",", header=T)

这是未分组的曲线

(sCurve <- summary(arr1 <- survfit(Surv(months, abs(censor-1))~1, data = rearrest)))

在其中索引元素很容易，例如

sCurve$n.event

除了这次根据 personal 变量的值分组之外，当我拟合相同的东西时，我准备好了两个不错的生存曲线对象。

(sCurveA <- summary(arr1 <- survfit(Surv(months, abs(censor-1))~personal, data = rearrest)))

一个对象被标记为 personal=0，另一个被标记为 personal=1。我已经尝试使用 $、[]、[[]] 进行索引，同时使用数字类型索引和命名-，但都无济于事。

有人能帮忙吗？

Answer 1

sCurveA$strata 以向量形式提供分组变量。你可以拉出关键部分并将它们扔到一个data.frame for ggplot.

df = data.frame(Time = sCurveA$time,
                Survival = sCurveA$surv,
                Strata = sCurveA$strata)

ggplot(df, aes(Time, Survival, col = Strata)) +
  geom_line()

索引单独的生存曲线

Indexing separate survival curves

r

survival-analysis