主讲老师第三十一课:KEGG分析
接下来,我们看一下 KEGG 富集分析(KEGG.zip)。Pathway 富集分析,可以找到富集差异基因的Pathway 条目,进而寻找不同样品的差异基因可能和哪些细胞通路的改变有关。 与 GO 分析不同,pathway 分析的结果更显得间接,这是因为,pathway 是蛋白质之间的相互作用,pathway 的变化可以由参与这条 pathway 途径的蛋白的表达量或者蛋白的活性改变而引起。
在 Pathway 分析中,以 KEGG 富集分析最为常用,KEGG 是一个整合了基因组、化学和系统功能信息的综合数据库。KEGG 下属 4 个大类和 17 和子数据库,其中有一个数据库叫做 KEGG Pathway,专门存储不同物种中基因通路的信息,也是用的最多的一个,所以,久而久之,KEGG 就被大家当做是一个通路数据库了。
首先,导入差异基因信息。
1.添加 ENTREZID 列
和 GO 分析一样,对差异基因信息进行 id 转换,并提取上调和下调的基因列表信息
2.KEGG 分析
与 GO 分析相对应,KEGG 分析使用 enrichKEGG()函数进行富集分析,最后,将分析结果保存为.Rdata文件。
3.结果可视化
3.1 柱状图
3.2 气泡图
3.3 网络图
3.4 网络图 2
4.绘制通路图
此外,我们还可以我们还可以展示通路中具体哪些基因发生了怎样的改变这里,我们需要借助 pathview 包,绘制这些差异在通路中的变化图。
4.1 单个样本通路图可视化
首先,如果对单个通路感兴趣,我们可以单独进行绘制。
4.2 所有通路图可视化
当然,我们也可以使用一个循环函数,将所有富集到的通路进行输出所有通路富集结果会自动输出到工作目录下,整个运行的过程根据数量的多少,时间会相应变化,好啦,关于 KEGG 部分就基本简单的介绍一下这几块内容。但是,学习了 R 以后,大家也别忘了生信全书上篇的内容,富集分析也可以通过数据库完成,数据库有时候也是很强大的