第 57 课

风险三联图的绘制

课程讲义导读 · 聚焦本课核心概念、分析流程与复现要点

说明:本页适合用于快速回顾本课重点、关键步骤与常用示例。

主讲老师第五十七课:风险三联图的绘制

风险三联图(riskplot.zip)是构建完预测模型后常用的展示形式,我们来看下整个的绘制过程。

1.R 包和数据准备

1.1 R 包准备

由于后续需要绘制热图,因此将 pheatmap 包进行加载

1.2 数据准备

首先读取表达数据,可以看到,这个数据是昨天 LASSO 分析后的一个输出结果形式。

按照 riskScore 对样品排序。

可以看看其中的内容,包含了生存信息,用于建模的基因表达信息,以及最后的风险评分和风险分组,其中,风险分组基于风险评分的中位数来进行划分

2.绘制风险曲线

接下来,我们来进行逐个的绘制获取风险分组,并使用 length() 函数分别计算 low 和 high 分组中样品数量其中高风险组 158 例,低风险组 159 例获取图中每个点对应的风险评分值 riskSore 作为纵坐标,并且为了图形的美观,将大于的 10 的评分改为 10,使用 range()函数查看整个的范围接下来,开始绘制第一个图,风险曲线。

首先,使用 plot()函数绘制点图接着,添加用于分组的虚线。

最后,使用 legend()函数在左上角添加标签信息。

3.绘制生存状态图

接下来,绘制第二张生存状态图。

同样,获取患者对应的生存状态,并赋予相应的颜色值。

首先绘制相应的生存分布图。

随后,将相应的标记添加到图中

4.绘制风险热图

4.1 获取表达数据

首先,获取相应基因的表达数据,并进行 log 转换。

4.2 构建注释文件

接着,按照 pheatmap 的要求,对列构建相应的注释文件。

4.3 热图

将对应的参数输入 pheatmap()函数中,关于这些参数的使用方法,大家可以复习一下热图绘制的内容。

最后,对三张图进行一个简单的解释,看看三张图组合后可以说明什么问题。

第一张图:样本的风险 Score 分布(根据中值分组),将风险得分按照从小到大的顺序排列,将风险得分(y 轴)与序号(x 轴)做散点图,当然,根据不同的需要,可以改变 cut-off值的范围。

第二张图:样本的生存时间分布,将按照风险得分排序后的生存时间(y 轴)和序号(x轴)做散点图,并按照结局将散点图分成红色和绿色,将第一张图和第二张图结合在一起,可以看出,随着风险得分的增加,生存时间呈现缩短的趋势,并且高危组的死亡比例(右侧的红点和蓝点比例)比低危组高,由此得出结论:高危组患者生存时间短,死亡率高。

第三张图:样本对应的基因表达值,上方的条形图代表高危组和低危组,与第一张图的结果一致,下方是将基因表达结果标准化后做的热图,其中红色表示高表达,绿色表示低表达,将三张图结合在一起可以得出结论,使用这几个基因构建的模型,风险得分越高,预后越差。

得到这三张图,大家可以在 AI 中将三者进行拼接,完成整个的风险三联图

← 返回批次1总导航