主讲老师第四十三课:ssGSEA 分析
接下来,我们来看下 ssGSEA 算法(ssGSEA.zip)的使用方法。在量化免疫浸润的时候,我们有两种主要的方法,第一种 CIBERSORT,他的结果是各个免疫细胞在一个样本中的占有率;而第二种 ssGSEA,是单样本 GSEA 分析,它得到的是一个富集分数,因此,如果输入的参考基因列表不一样,或者样本数量不一样,最后给出的富集分数权重也是不同的。这里呢,我们主要介绍一种最常用的 cellmarker 列表,包含了 28 种免疫细胞的 marker。下面,我们来看下 ssGSEA
的分析方法
1 R 包及相关文件的准备
1.1 R 包的安装及读取
对于这个分析,其使用的 GSVA 包进行分析,准备细胞 marker。这里也可以发现,ssGSEA分析免疫细
胞浸润的原理实际上和 GSVA 分析的原理是类似的。
1.2 准备细胞 marker
这里,我把整理好的 cellmarker 文件发给大家我们用 data.table 包里面的 fread()函数读取进来,点开这个数据内容来看一下第一列是基因名字,第二列是我们所需要的细胞类型,但是,目前 cell type 之间有一个空格,我们先要把它去掉。如果有空格,后期的使用可能会受到影响使用 colnames(cellMarker)[2]取列名的第二个变量,重新赋值。接着,我们需要对这个文件进行基本的
处理:
使用 spilt()函数,对 cellMarker 数据框进行拆分,拆分的原则是以 cellMarker 的 celltype进行分类我们可以看到,生成了一个新的列表,里面每个细胞细胞类型对应一个子集。
接下来,就是使用昨天讲过的一个函数,lapply()函数来遍历每个子集,对 type 这个 list中的每个子集,进行 function 函数的操作,截取里面的基因名,去重复,组合到一起。
这样,cellMarker 文件基本准备好了。
1.3 表达量矩阵的准备
对于基因表达文件,需要行是基因,列是样本。
这一套标准的操作应该是比较熟悉的了
2. 使用 ssGSEA 量化免疫浸润
这里就是整个分析的重点内容,使用 method="ssgsea"对浸润情况进行评估:
最终,我们得到了 28 种免疫细胞的浸润水平。
3. 简单作图可视化展示
关于 ssGSEA 的可视化结果,我们简单的展示一下当然,在 CIBERSORT 中讲到的一系列方法,除了第一种外,其余的都可以应用在 ssGSEA分析中。