第 46 课

immuneSubtypeClassier

课程讲义导读 · 聚焦本课核心概念、分析流程与复现要点

说明:本页适合用于快速回顾本课重点、关键步骤与常用示例。

主讲老师第四十六课:immuneSubtypeClassier接下来,给大家介绍一种免疫分型的分析方法,除了通过聚类分析,重新构建模型。早有科学家基于对TCGA 数据库大样本的肿瘤患者免疫特征进行分析整合,以此提出了六种经典的免疫特征分型,并将该研究成果发表在 Immunity 杂志上(IF = 22.553)下面,我们一起来看下整个文章的分析思路,以及在后续生信分析中的应用方法

1.总览全文

在本文中,作者对 TCGA 数据库中 33 种癌症,超过 10,000 个肿瘤样本进行了免疫原性分析,通过比较不同组织间巨噬细胞或淋巴细胞特征、Th1:Th2 细胞比例、肿瘤异质性程度、非整倍性、新抗原负荷程度、细胞增殖、免疫调节基因的表达、预后等指标的差异,最终提出了 6种不同的免疫分型:C1:伤口愈合(wound healing)、C2:IFN-γ特性(IFN-γ dominant)、C3:炎症(inflammatory)、C4:淋巴细胞耗竭(lymphocyte depleted)、C5:免疫抑制(immunologically quiet)、C6:TGF-β特性(TGF-β dominant)。

研究发现,在所有癌症中,特定驱动基因的突变与较低的(CTNNB1,NRAS 或 IDH1)或较高的(BRAF,TP53 或 CASP8)白细胞水平相关。同时,细胞内和细胞外网络的多种控制方式(转录,microRNA,拷贝数和表观遗传过程)参与了不同免疫亚型之间和之内的肿瘤免疫细胞相互作用。

2.基于 R 语言的计算分析

讲解了那么多,那么针对一个新的数据集,应该如何将其与文章中的免疫分型进行匹配呢?作者很贴心的将文章相关的代码上传到了 GitHub 上供大家学习使用。由于文章中所用的数据格式相对较为严格,后期作者对此进行了修改,形成了一个新的 R 包,并保存在https://github.com/CRI-iAtlas/ImmuneSubtypeClassifier 下面,一起看下整个分析流程

下面,我将带大家一起学习下整个分析流程

2.1 R 包的安装与读取

首先,是 R 包的安装。基于 R 的 xgboost 包和 plotROC 包,作者开发了一个名为"ImmuneSubtypeClassifier"的包(ImmuneSubtypeClassifier-master.zip),并将 其 保 存 在GitHub 上。

对于 R 包,xgboost 包需要下载安装旧版本 1.0.0.2 版本!!!!不然整个包尽管能顺利安装,后续的分析是出不来的。因为在 xgboost 包更新以后,ImmuneSubtypeClassifier 包没有进一步进行维护更新,导致更新后的 xgboost 包无法适用。

在这里,对于该 R 包的安装,我直接从 GitHub 上下载了相关内容,大家可以通过本地导入,直接安装包的相应内容。

2.2 数据读取与分析

接下来,就是分析环节,将准备好的数据读取与分析过程。

通过 callEnsemble()函数最终可以计算得到每个样品在 6 种不同免疫分型中的评分。当然,在callEnsemble()函数中,geneids 的内容既可以是 gene symbol,也可以是 Entrez ids但一般还是推荐gene symbol在结果中分别展示了 TCGA-LUAD 患者在 6 种不同免疫分型的评分,同时,结果还给出了该患者对应的最佳分型。

3.TCGA 病人免疫特征

对于 TCGA 数据库中患者免疫学特征的分析,还有另外一种简便的方法。由于整个文章的 分 析 主 要 基于 TCGA 数 据 库 的 测 序 数 据 , 我 们 可 以 从 UCSC XENA 网 站(http://xena.ucsc.edu/)进行下载,在这里,简单介绍一下下载方法

3.1 首先,打开 UCSC XENA 网站,并点击 Launch Xena

3.2 点击 Dataset

进入数据下载页面

3.3 选择“TCGA Pan-Cancer (PANCAN) (41 datasets)”

点击进入,在“phenotype”板块,选择免疫板块“Immune subtype (n=9,126)”,进入数据页面。

3.4 在该页面中,展示了样品名称信息和对应的免疫亚型

点击 download 处的链接,即可下载所有患者的免疫分型数据。

这样,整个 TCGA 患者的免疫分析就得到了,根据需要,提取自己的数据即可。好啦,6 种免疫细胞的浸润水平方法就介绍好了。好好运用这部分内容,至少能给你的文章增加一张大的 Figure,大家课后再

复习一下这部分的几种分析方法,同时也可以比较一下,同样的

样品,在不同分析中得到结果的差异。另外说明一个,虽然这几种方法的最初是来源于肿瘤,但是目前

很多文章也开始在使用这些方法应用于非肿瘤分析里面。

← 返回批次1总导航