Nature综述|细胞相互作用工具汇总
生信干货
虎哥 ·2020年11月26日 01:51
Hello!大家好呀,提到细胞间的相互作用,大家会想到什么呢?配受体?还是单细胞测序的最后的配受体套路,下面介绍一篇发表于Nature Reviews Genetics 的综述性研究,们重点介绍了通过转录组数据分析细胞间相互作用的发现,并回顾了当前使用的方法和工具。
多细胞生命依赖于细胞活动的协调,而细胞活动取决于生物体不同细胞类型和组织中的细胞间相互作用(CCI)。因此,对细胞功能的研究越来越需要考虑每个细胞的所处环境。CCI利用各种分子,包括离子,代谢物,整联蛋白,受体,连接蛋白,结构蛋白,配体和细胞外基质的分泌蛋白。一些分子支持结构性CCI(例如,细胞粘附分子),而诸如激素,生长因子,趋化因子,细胞因子和神经递质等配体介导细胞间通讯(CCC)(图1a)。CCC背后的信号转导通常是由各种类型的蛋白质相互作用介导的,包括配体-受体,受体-受体和细胞外基质-受体的相互作用。受体细胞通过同源受体触发下游信号传导,通常最终导致转录因子活性和基因表达的改变。这些表达改变的细胞进一步与其微环境相互作用。要了解每个细胞在所处环境中的作用,必须确定在细胞之间传递的蛋白质信息。
在图1a中,分别展示了自分泌,旁分泌,近分泌和内分泌的通路简图。自分泌信号转导是指细胞内通讯,细胞分泌配体,这些配体用于通过同源受体诱导同一细胞上表达的那些分子的细胞应答。旁分泌细胞间的通讯不需要细胞间的接触,而是取决于信号分子在分泌后从一个细胞扩散到另一个细胞。近分泌,即依赖于接触的细胞间通讯依赖于间隙连接或膜纳米管等其他结构,使信号分子直接在细胞之间传递,而不会分泌到细胞外。内分泌细胞间的通讯代表细胞间的通讯,信号分子被分泌并通过诸如血浆的细胞外液传播很长一段距离。这种交流的典型介质是激素。解析CCC
有多种策略和方法可以对细胞之间的通讯进行推测,尤其是在单细胞转录组测序之后,以RNA为代表的细胞信息之间的相互作用更能够对其进行解析。如下图显示的工作流程:
Step1:通过转录组学分析样品或细胞,以测量基因的表达;Step2:然后对生成的数据进行预处理以构建基因表达矩阵,其中包含跨不同样品或细胞的每个基因的转录水平;Step3:从其他来源生成或获得参与细胞间通讯的相互作用蛋白列表,通常包括分泌蛋白和膜结合蛋白(分别为配体和受体)之间的相互作用;Step4:在基因表达矩阵中仅保留与相互作用蛋白相关的基因。Step5:它们的表达水平用作输入,使用评分函数(函数f(L,R),其中L和R分别是配体和受体的表达值)来计算每个配体-受体对的交流得分。可以使用聚合函数(函数g(Cell 1,Cell 2),其中Cell 1和Cell 2都是这些细胞或相应样本的所有通讯得分,可以汇总这些通信得分以计算各个样本或细胞之间的总体交互状态。);Step6:最后,可以通过Circos图和网络可视化来表示交流和汇总分数,以方便对结果进行分析解释。构建PPI
从转录组推断CCC依赖于基因共表达,即给定对中的一个基因来自一个相互作用的细胞,另一个基因来自第二个相互作用的细胞。一些研究集中在使用所有基因或特定细胞标志物的共表达,表达谱之间的相似性或调节网络的特性。但是,大多数研究都依赖于文献记载的相互作用蛋白列表,这有助于对结果进行生物学解释(图2a)。更新的计算工具,例如CellPhoneDB,CellChat和ICELLNET,包括多聚体蛋白质以及配体和受体的复合物之间的相互作用。例如,CellChat包含约2,000个配体-受体相互作用,其中约48%代表异二聚体的相互作用,比CellPhoneDB中的约900个配体-受体对显着增加。
细胞正在使用哪些通讯信号?
为了阐明相互作用细胞利用哪些生物学过程进行交流,通常使用它们的同源基因的表达作为评分功能的输入来估计每对相互作用蛋白的得分。重要的是,这些方法的主要假设是(1)基因表达反映了蛋白质的丰度,(2)蛋白质的丰度足以推断PPI强度,而忽略了它们结合的必要因素,例如翻译后修饰或多亚基复合物装配。在这里,我们关注配体-受体对作为PPI,但是,这些策略可以扩展到任何细胞间PPI。大量样品可能会错过某些相互作用的配体-受体对,因为平均所有细胞的基因表达都可以掩盖来自低丰度细胞的信号。这些二元方法都假定相互作用需要更高的表达水平,并且需要选择基因表达阈值(显着性或基因表达幅度),这可能导致假阳性和/或假阴性。一般阈值可能会失效,因为(1)一些蛋白质具有浓度依赖性的不同生物活性,并且(2)基因之间的mRNA-蛋白质水平相关性不同。因此,应制定基因特异性阈值,因为一般阈值可能无法正确代表蛋白质的存在和活性。下图表示使用不同计算函数对通讯评分进行定量分析。
CCC分析工具
除了核心评分函数(图2b)之外,许多工具还使用高级统计方法来识别细胞间通讯(表2)。根据用于识别配体-受体相互作用的数学模型,现有的计算工具可以分为四类之一,此处分类为(1)基于差分组合,(2)基于网络,(3)表达排列 (4)基于数组的工具。




这些工具还包括强大的可视化功能,可促进结果的解释。图4概述了几种较常见的可视化方法,并通过直接绘制配体-受体共表达模式和交流得分(图4a–c)来显示数据, 因此,这些工具不仅可以量化CCI和CCC,还可以方便地对其进行分析和解释。
图 4 细胞间交互和通讯的可视化技术
结论
从基因表达中推断出CCI和CCC的多种策略阐明了细胞在环境中的基本作用以及它们如何塑造细胞功能,在未来的应用中具有巨大潜力,尤其是在生物医学和生物治疗学中。每种推论CCI和CCC的方法都有其自己的假设和考虑的局限性。当人们使用这样的策略时,重要的是要意识到这些优点和缺点,并选择适当的参数进行分析。参考文献
Armingol, E., Officer, A., Harismendy, O. et al. Deciphering cell–cell interactions and communication from gene expression. Nat Rev Genet (2020).