主讲老师第五十课:批量生存分析
一般而言,经过差异分析,过滤掉一部分基因,最终,我们还是会得到几百个基因,这时候,一个个进行生存曲线的绘制和分析肯定是不方便的,这就需要我们进行批量的生存分析,这里,我们来介绍一下批量基因的 cox 生存分析以及使用森林图的可视化展示。下面,我们来看下如何进行批量基因的 cox 生
存分析
1.准备工作
1.1 加载 R 包
在这里,我们同样使用 survival 包进行批量分析,同时使用 forestplot 进行可视化展示。
1.2 加载数据
接下来,将表达数据,生存数据和差异分析数据读取进来。
(1). 读取表达谱(2). 读取生存信息(3). 读取差异表达结果文件这里,我们使用 logFC 的阈值为 1,fdr 为 0.05,通过阈值,提取差异表达基因名称(4). 构建生存表达数据框接下来,根据差异基因和生存情况,构建生存表达数据框。
提取差异基因表达,与生存信息进行合并。
这样,输入文件到这里基本准备好了。
2.Cox 分析
接下来,开始批量的生存分析,批量分析,自然涉及到了循环的构建在此,首先设置一个空的变量,用于保存后续的输出结果,接着,循环开始,对于 i 的取值,由于前两列为生存信息,因此,从第 3 列开始,然后,构建 cox 模型,将模型的输出结果 summary(cox)赋值给coxSummary。
然后分别提取其中的 HR 值等信息,保存到预先设置的变量 Coxoutput 中最终得到输出结果(univariate cox regression results regarding DEGs.txt)。
随后,我们根据 pcutoff <- 0.001 来进行取值,选取 P 小于 0.001 的来进行后续的绘图。
最终一共得到 10 个 top 基因。
3.绘制森林图
随后,我们来绘制森林图。
3.1 输入表格的制作
对于森林图的绘制,我们首先要对输入格式进行整理。
3.2 绘制森林图
然后,将上面整理好的表格作为输入数据,使用 forestplot()函数进行简单森林图的绘制通过指定参数 mean,lower 和 upper,得到一幅简单的森林图。
接下来,我们进一步根据 forestplot()函数的相关参数对图形进行整理美化这样,10 个 top 基因就快速的计算得到了。