第 52 课

单因素和多因素 cox 回归分析

课程讲义导读 · 聚焦本课核心概念、分析流程与复现要点

说明:本页适合用于快速回顾本课重点、关键步骤与常用示例。

主讲老师第五十二课:单因素和多因素 cox 回归分析

讲一下如何做单因素和多因素 Cox 回归分析,接下来的话是讲一下如何构建临床预测模型,我们一共讲一下在生信文章里最常见的四个预测模型,分别是 LASSO Cox 回归模型,随机森林模型,支持向量机模

型,以及主成分分析模型,这四个都是常常出现在文章中用于

基因集的预后模型构建方法,当然,这几个方法同时可以起到降维的作用,因此,在临床研究中,比如

影像组学分析中,也会经常被使用到,用于特征提取步骤。

因为这部分内容是两篇文章里都没涉及到,我就直接从 TCGA 数据库中随机截取一部分病人进行分析演示了,我们来看下如何进行单因素和多因素 Cox 回归分析(HRtable.zip)。

1.读取数据

首先,我们把相应的临床数据读取进来可以看到,其中包含了 200 个患者,12 个不同的临床指标信息

2.数据整理

接下来,我们需要对数据进行整理归纳,包括两个方面:1.将数值型变量转换成二分类变量;2.根据等级水平,将分类变量转换为因子,并同时设置相应的因子水平,比如,性别这种二分类变量,直接将其转换成因子即可而对于数值型变量,则需要先分组,再进行因子转换。

同理,对剩下的 10 个变量依次进行相应的转换。

同时,对于基因 mir195 和 YAP1,一样的根据中位数进行分组转化这里注意一下,mir195 这里不建议改为 mir-195,否则后面的 cox 单因素分析过程可能会出错。

再次查看整理后的数据数据类型。

3.单因素回归分析

设置一个空的数据框 outTab 用于保存分析结果,同时,通过 for 循环,对每个变量逐个进行单因素Cox 分析。其中,coxph()函数被用于模型的构建,最终,所有的分析结果均保存在 outTab 中。

最后,将结果进行保存。

4.多因素回归分析

接着,使用 coxph()函数进行多因素 Cox 回归分析,进行模型的拟合,这里注意一下,可以使用单因素分析中有意义的结果纳入多因素分析,标准值可以设置为 0.1 或者 0.05,0.01均可。

在此,我是直接纳入了所有的指标进行后续的多因素 Cox 回归模型同样的,提取其中对应的系数,以及 95%可信区间和对应的 P 值。

接下来,我们使用 ggforest()函数来对多因素 Cox 回归模型结果可视化展示将结果 multiCox 作为输入数据。

这样,一张基于多因素分析的森林图就绘制完成了

← 返回批次1总导航