第 49 课

生存分析

课程讲义导读 · 聚焦本课核心概念、分析流程与复现要点

说明:本页适合用于快速回顾本课重点、关键步骤与常用示例。

主讲老师第四十九课:生存分析

下面,我们来看下一个十分常见的分析内容,生存分析和生存曲线的绘制(survival.zip)。我们使用文章里的数据,来看看如何绘制花式的生存曲线。在生存曲线绘制部分,我们还是介绍两个包的使用吧,到目前为止,大部分的内容,都介绍了两种及以上的方法,够大家挑选使用的了。下面,我们来看下如何绘制生存曲线图

1.数据的读取与整理

首先,我们把分析需要的数据读取进来。

1.1 读取 ESTIMATE 评分信息

1.2 读取生存信息

一个免疫评分文件,用于分组,一个生存信息文件。

接下来,我们合并得分以及生存信息

1.3 分组

整理到这里,还缺一个分组信息,对于分组操作,大家已经不陌生了。

分组并转换为因子,这步一定记得操作,不然两条生存曲线反了也是有可能的。课后大家可以把因子转换这步删掉,看下最后的结果,完全相反的结论table()一下,低的 251 例,高的 250 例,如果是一路学习到这里的,数据清洗的操作一般已经是没有问题的了,接下来,我们先看看如何使用基础包进行绘制。

2.生存分析

首先,我们需要使用 survival 包来进行统计计算。

这里,两个地方可以查看 p 值,第一个,直接查看 fitd。

可以看到 p 值为 0.03,当然,也可以进一步计算确切值。

2.2 拟合生存曲线

接下来,我们需要借助 survfit()函数对两条曲线进行拟合。

关于拟合结果,也可以直接使用 summary(fit)来进行查看。

3.绘制生存曲线

3.1 基础包绘制生存曲线

下面,我们一步步来进行绘制,逐个添加内容进去1). 绘制曲线2). 添加置信区间3). 设置颜色,坐标光秃秃的几条线,太丑了,我们接下来给他们添加颜色。

4). 添加标签这里,问题就来了,blue 和 red 分别是谁?这时候就显示出前面因子的作用了,blue对应 low,red 对应 high,如果不进行设置,它会字母排序对应,结果正好反一反,结论也就反一反了。搞清楚这一点对应关系后,我们来添加标签5). 添加 P 值首先,设置一个标签 p.lab,然后,再以文本的形式添加进去。

3.2 survminer 包绘制生存曲线

接下来,我们来看看另外一个包的绘制方法。

这里,我们来介绍一下 surviminer 包的使用方法,首先,使用默认参数,绘制一个简易的曲线。

因为这个包是在 ggplot2 和 ggpubr 的基础上进行构建的,因此其风格和 ggpubr 包还是比较类似的。

接下来,添加 P 值和 95%可信区间。

绘制到这里,和前面的基础包比较类似,然后,进一步添加内容,添加风险表格和中位生存时间线。

再进一步修改参数,设置 x 轴坐标及相关名称。

最后,和 ROC 部分一样,基于各种参数的综合,给出一个终极的版本。

学会了单一指标的生存分析后,接下来我们来看下如何进行批量的生存分析。

← 返回批次1总导航