主讲老师第三十六课:ceRNA网络构建
先来简单介绍一下 ceRNA,ceRNA,并不是新的 RNA 分子,只是一种的调节机制。ceRNA(competing endogenous RNAs,竞争性内源 RNA)假说揭示了一种 RNA 间相互作用的新机制。同样,对于 ceRNA 网络的构建也存在多种方法。之前,关于 ceRNA 网络的构建,我们往往是这种分析思路:首先,通过差异分析,获得差异表达的 mRNA,lncRNA 和 miRNA,然后与数据库取交集,最终得到 ceRNA 网络(ceRNA.zip)。但是,很多情况下,我们并不会同时获得 mRNA,lncRNA 和 miRNA三个的表达结果,因此,我们今天讲讲另外一种方法。从 mRNA 到 ceRNA 网络,这里主要使用multiMiR 包进行分析,在 multiMiR 包中结合了 14个数据库,我们可以直接使用这里面的数据库来进行miRNA 的选择,其中包括了经典的mirTarbase 数据库,这里主要是肿瘤结果,但是已经实验验证相互关系了的,已经没必要分肿瘤和非肿瘤了。下面,我们来看下 ceRNA 网络的构建。
首先,还是将差异分析的结果进行读取
1. R 包安装
在此,使用 multiMiR 包来进行 ceRNA 网络的预测。
2. 从 mRNA 得到 miRNA
2.1 选取差异基因
我们首先获取差异表达基因作为输入基因,结果显示:其中差异表达基因一共 482 个
2.2 预测 miRNA
接下来,我们来预测可能的 miRNA,这个工具可以从 mRNA 得到 miRNA,也可以从miRNA 得到mRNA。同时,除了人类,其也可以进行鼠的 ceRNA 网络预测。在分析过程中,R 包会对输入基因通过不同数据库进行搜索。
可以看到,在分析过程中,分别对 mirecords,mirtarbase 和 tarbase 三个数据库进行了检索分析
2.3 选取 mirtarbase 数据库的预测结果
这里,我们选取 mirtarbase 数据库的预测结果来进行分析提取使用数据库为 mirtarbase 的结果,一共得到 7090 条预测结果。
2.4 选择实验验证等级
接下来,我们进一步进行选择,在里面,有不同等级的数据:
根据数据来源的不同,其对预测结果的可靠性进行了分类,我们可以筛选其中经过最严谨的 Luciferasereporter assay 实验验证的结果。
进一步缩小后,最终得到 106 条相互作用结果。
接下来,我们把里面的 miRNA 和 mRNA 进行提取。最后,将结果稍作整理,对列名重新定义。
3. 从 miRNA 得到 lncRNA
得到了 miRNA 后,我们需要预测 lncRNA。关于 lncRNA 和 miRNA 互作的数据库主要是 3 个数据库,分别是 mircode,starbase,mirnet,这里,我们来使用 starbase 数据库的使用。这里呢,下载了里面相互作用的列表(starBaseV3_hg19_CLIP-seq_lncRNA_all.txt)。直接下载里面所有 lncRNA 和miRNA 互作的数据,后面就不需要借助数据库,直接在 R 里面根据自己的需要进行筛选即可。这个不是直接下载的,是用终端命令下载的,大家直接使用就可以了。
将数据库整体的结果读取进来。结果显示:其中包含了 71952 条相互作用信息,如果感兴趣的话,大家也可以点开来看看然后,从数据集里面进行提取,取交集的 miRNA 信息,最终得到 68 个不同 miRNA。这样,整个过程就避免了多次进入数据库里面一个个查找了,包括人类的,鼠的,都可以下载。
在这里,我们也同样可以设定进一步的筛选标准。我们根据数据库的使用介绍,将标准设定在pancancerNum >10 和 clipExpNum>4,pancancerNum >10 保证在 10 种以上肿瘤中得到验证。这样得到的数据结构可靠性会更高一点,便于后期的实验验证,当然,如果结果不好的话,也可以稍微放宽条件。
经过筛选,最终得到了 69 条结果。然后,将其中的 lncRNA 进行提取去重。
最终得到 37 条相互作用的 lncRNA,同样,对结果进行整理这样,mRNA,miRNA 和 lncRNA 基本预测得到了。同时,三者的关系,也保存在了 node1和 node2中。接下来,将其汇总作为 Cytoscape 的输入文件
4. Cytoscape 输入文件
将 node1 和 node2 进行合并,作为输入文件。同时,准备一份 type 的输入文件,和PPI 网络一样,作为颜色和形状参数的修改。因为 cytoscape 软件的使用比较类似,大家可以参考转录调控网络的构建过
程,好啦,整个转录组部分的标准分析流程就给大家基本好了