1、定义 细胞活动的协调对于多细胞存在至关重要,它取决于整个生物体中各种细胞类型和组织之间的细胞间相互作用。细胞间通讯是一个重要过程,它深刻影响生物体的体内平衡、发育和疾病过程。通常,细胞通讯涉及与分泌的配体和质膜受体的相互作用,但它也包括分泌酶、细胞外基质蛋白、转运蛋白和直接的细胞间接触机制。不同的细胞使用不同的细胞通讯来确保生物发育、稳态和组织修复。例如,在免疫反应期间,细胞通讯使免疫细胞能够识别和对抗病原体。
在生长发育过程中,细胞通讯调节细胞增殖和分化,促进器官和组织的正常发育。当细胞无法正确相互作用或误解分子信息时,通常会表现出疾病。细胞通讯的复杂性已被公认为发育生物学、致癌作用和器官功能障碍分子机制的一部分。探索不同条件下的细胞通讯动态变化,可以更深入地了解不同生物过程的潜在机制,并有助于阐明疾病发生和发展背后的机制。
目前,单细胞RNA测序(scRNA-Seq)已在多个研究领域得到广泛应用,以研究配体-受体动力学在细胞间通讯中的关键作用。单细胞RNA测序等技术使研究人员能够探索多细胞生物体内不同细胞类型之间错综复杂的通讯模式,为细胞通讯机制、细胞功能和细胞群组织提供新的视角。细胞间通讯分析有助于了解细胞之间的相互作用,剖析通讯网络,揭示发育过程中的各种细胞相互作用,探索肿瘤免疫微环境,并确定疾病的潜在治疗靶点。
因此,识别和量化细胞间信号通路已成为不同学科的标准做法。通过配体-受体相互作用(LRI)激活特定的细胞信号通路构成了细胞通讯的基本模式,并与各种退行性过程和疾病有着错综复杂的联系。从历史上看,细胞通讯研究主要局限于在体外进行的实验,涉及一种或两种类型的细胞和一组有限的基因。随着科学技术的进步,单细胞水平的数据采集能够检测低丰度基因,并为细胞通讯研究提供了坚实的基础。近年来,许多研究工作致力于制定基于这些相互作用构建细胞通讯网络的策略。
利用这些技术,许多实验室开发了各种用于细胞通讯研究的算法和软件。2、不同细胞通讯软件的比较 这里我们参考了一篇2024年发表在Nature Reviews Genetics杂志上面的文献,文献的标题为“The diversification of methods for studying cell–cell interactions and communication”。
2.1 互作预测过程 文中列举的核心工具可以利用已知的配体-受体相互作用(LRIs)来推断样本中的细胞间相互作用(CCIs)。这些核心方法通过分析配体和受体的表达水平来阐明细胞间如何进行交流,从而提出新的生物学假说。其预测步骤大致可以分为三步:(1)对基因表达矩阵进行筛选,仅保留配体和受体。(2)将每种基因的表达水平在特定细胞类型的所有单细胞中进行汇总(例如,通过计算单细胞的平均表达水平)。
(3)第三,对于样本中每一对细胞类型,评估每个候选LRI,考虑发送细胞类型的配体表达水平和接收细胞类型的受体表达水平。最后针对每一对细胞类型中的每个LRI分别计算一个交流得分(例如,这可以是发送 - 接收细胞类型对中配体和受体表达水平的乘积、平均值或几何平均值)。为了进一步识别基于假设的细胞间相互作用(例如识别特定细胞类型的长程相互作用),可以进一步进行包括置换检验、参数检验和非参数检验在内的统计分析,以确定显著的相互作用。
因此,计算工具能够识别重要的细胞间相互作用,并生成可进行实验验证的生物学假设。2.2 主要研究成果 下图展示了推断细胞间相互作用的计算工具的系统发育树。用于推断细胞间相互作用(CCI)的计算工具从核心工具的“根”部发展而来。从这个根部出发,方法变得更加专业化以应对特定的场景(中心的灰色箭头)。从中心生长出的主要分支代表工具的主要特征(“核心工具”、“更精细”、“更深入”、“更广泛”、“更局部化”或“其他改进”)。
彩色方框表示每个工具命运或子组的次要特征,共展示了105种工具。核心工具依赖于核心或类似的评分函数,是CCI分析的一般框架。例如我们在本教程给大家带来的CellChat、icellnet以及依据python语法开发的CellPhoneDB工具为代表的核心工具,位于系统发育树的核心工具的分支中,供研究界从转录组学中推断细胞间相互作用。2.2.1 基于规则的工具(如icellnet)纳入了关于CCI行为的假设或先验知识。
它们利用与配体和受体数量相关的原理(例如对配体和受体表达进行阈值处理,或使用表达水平作为描述相互作用模式的连续核心函数的输入)来建模相互作用。基于规则的工具通常能产生一致的结果,这是因为它们依赖于基于基因表达的公式。但是,基于规则的方法可能难以应对更高的CCI复杂性、噪声数据和未考虑的变量。2.2.2 基于数据的工具主要使用统计测试或机器学习(如差异分析、标签置换、回归模型、因子分解方法和深度学习)来解释基因表达。
这些方法即使在潜在机制尚不明确的情况下(例如涉及非配体-受体相互作用(非LRI)的情况),也能揭示大型数据集中的意外相关性和隐藏模式。例如,DIALOGUE、MISTy、scITD采用不同类型的分解方法来提取细胞间通讯的特性,尽管它们需要大量的数据。相比之下,数据驱动的工具在处理相同的数据集时可能会产生不同的输出。这是由于统计测试(如置换)的内在随机性以及机器学习算法(如基于梯度的方法)的初始化所导致的。
2.2.3 混合模型通过结合基于规则和数据驱动的策略来发挥各自的优势。例如,CellChat和CellPhoneDB首先通过基于表达式的公式推断细胞间相互作用以确保一致性,然后使用统计测试提取显著的长程相互作用。2.2.4 其他分支 更精细 分支能够以单细胞分辨率全面获取见解。前面我们提到的一些计算工具主要是在伪总体水平上应用的,即把单个细胞聚集成簇或细胞类型。
这种方法有效地解决了scRNA-seq中每个细胞中测量到的转录本通常较为稀疏的问题。然而,最近的方法现在能够以真正的单细胞分辨率处理这些数据,推断出成对单个细胞之间的相互作用。如SPRUCE和DeepCOLOR将单个细胞的基因表达投影到潜在空间,并利用这些信息推断单细胞对之间的细胞间相互作用。更深入 分支可以窥探细胞内活动。细胞通讯接口涉及多种分子类型,包括离子、小分子化合物、肽和蛋白质。
这些分子在细胞外(例如对于长程细胞间通讯)和细胞内(例如对于信号传导、基因表达调控和配体生物合成)都很重要。然而,基于转录组学的工具通常仅限于推断蛋白质配体,其丰度与基因表达的相关性高于其他类型的配体。要估算涉及非蛋白质配体(如小分子)的细胞间通讯,新一代工具可以分析产生或消耗代谢物配体的酶的表达情况,从而捕捉其通讯潜力。MEBOCOST通过整合代谢物受体和代谢物-转运体相互作用的精选数据库来推断基于代谢物的细胞间通讯。
另外,细胞内信号通路还包括转录因子及其下游靶点,也可以被考虑在内。正如NicheNet则可以实现配体→受体→转录因子→靶基因的预测。更局部化 分支从空间上对细胞进行定位。细胞位置会影响细胞间相互作用以及相关的基因表达。从产生它们的细胞中扩散出去,形成浓度梯度,并在接收细胞中触发不同的信号传导程序。这个分支上的工具更广泛地促进了空间数据的分析。
例如,Giotto和Squidpy帮助用户可视化空间数据,并在细胞或点之间进行分析,如聚类和邻域检测,但它们也提供了用于推断CCI的信息。更广泛的 分支可以考虑多种情况。细胞间相互作用在很大程度上取决于其发生的生物学环境。不同的遗传、细胞、细胞外或时间状态等生物学环境会影响单个细胞和整个组织的行为。这些环境在不同表型条件下存在差异,这使得在单细胞图谱中研究细胞间相互作用变得困难,尤其是在样本数量庞大的情况下。
随着样本中实验变量数量的增加,分析的复杂性呈指数级增长。这时候我们可以借助一些工具进行不同条件之间的差异分析帮助我们快速定位不同条件下的细胞通讯差异。如CellChat可以进行细胞类型间、样本间或不同组间两两比较来寻找差异CCI。3、实验追踪细胞间相互作用 除了基于软件分析的方法推断细胞间的细胞通讯,我们其实还可以借助实验的方法去追踪细胞之间的相互作用。例如荧光原位杂交、免疫染色等方法。
然而,这些方法难以用于验证大规模单细胞RNA测序研究得出的CCI预测,因为它们在给定实验中仅能检测少数细胞和长程相互作用(LRIs)。新一代实验方法也正在涌现,提高了CCI测量的通量。如ProximID、PIC-seq这些方法可以同时测量许多LRIs和细胞对。4、总结 近年来,用于研究细胞间通讯(CCIs)的工具经历了显著的多样化发展。计算工具已从基于核心基因表达的方法演进到结合细胞其他生物学特性的下一代策略。
同样,更先进的实验方法提高了通量能力,能够同时分析多个通讯途径,从而为细胞间通讯提供了更全面且具有生物学意义的见解。计算方法和实验方法具有很强的互补性和协同性,这将扩大其在生物医学和个性化医疗等领域的应用潜力。因此,把握这些新机遇对于进一步深化对细胞间通讯的理解至关重要。