单细胞RNA测序(scRNA-seq)可以识别组织内的细胞亚群。scRNA-seq技术的出现,使得人们可以对细胞的基因组学、转录组学以及表观基因组学进行精准的研究。但不能捕捉它们的空间分布,也不能揭示细胞间通讯的局部网络。而空间转录学方法正好相反,于是单细胞测序联合空间转录组测序分析就这样诞生了。同时,一个关键问题诞生——如何将这两者整合?
☆本文看点☆
一、单细胞测序联合空间转录组测序一般流程
二、单细胞测序联合空间转录组整合方法
三、Cell2location介绍
四、小编总结
一、单细胞测序联合空间转录组测序一般流程
Nature杂志及其子刊每年都会总结一年中的研究成果,根据每个领域的重大发现,推选出最有价值的技术为年度技术。2018年的“单细胞转录组技术”、2019年的“单细胞多组学技术”以及2020年年度技术方法“空间转录组技术”无疑不证明了单细胞和空间分辨率转录组技术应用的重要性。在转录组技术的发展的历程中,我们已经有了bulk RNA-seq、scRNA-seq、ST RNA-seq(空间转录组测序)。bulk RNA-seq对大量混合细胞进行转录组测序,但是该方法只能获得基因平均表达水平。scRNA-seq对细胞基因表达的认识推进到单细胞的层面,目前已在发现新的细胞类型、揭示细胞异质性等方面展现出优势。但单细胞测序会失去了组织空间位置信息。ST RNA-seq可以同时获得细胞的空间位置信息和基因表达数据,但目前还达不到单细胞精度。在这里,作者提出了一种结合单细胞RNA序列(scRNA-seq)和ST(空间转录组)法来研究的方法。在这种方法中,首先对肿瘤(处理组)组织进行分割,从其中一部分产生单细胞悬浮液,并对其进行scRNA-seq处理,以识别组织中存在的细胞群体。从剩余的组织中,冷冻切片使用ST方法进行处理,以提供整个组织中表达的转录本的无偏图谱。然后,就是本文关注的重点:通过引入什么样的方法来整合这两个数据集。
二、单细胞测序联合空间转录组整合方法
鉴于空间转录组学方法还不能在组织中产生深层单细胞分辨率的转录组图谱,能够成功整合单细胞和空间转录组数据的分析将有助于理解细胞类型分布的结构以及构成这种结构的细胞间通讯的假定机制。整合scRNA-seq和空间转录组数据有两种主要方法:去卷积(Deconvolution)和映射(Mapping)。去卷积旨在根据单细胞数据,从每个捕获点的mRNA转录物的混合物中分离出离散的细胞亚群;映射有两方面:将指定的基于scRNA的细胞亚型定位到HPRI(high-plex RNA imaging)图谱上的每个细胞和将每个scRNA-seq细胞定位到组织的特定区域。
去卷积:从单个捕获点中分离出离散的细胞亚型。去卷积有两种主要方法:推断一个特定spot的细胞亚型比例和对一个特定的空间转录组spot进行评分,以确定它与单个细胞亚型的对应程度。
Inference-based的去卷积技术估计每个细胞类型在特定捕获点的比例。这种形式的去卷积的方法之一是采用基于统计回归的模型,并使用scRNA-seq数据矩阵来去卷积每个捕获点的mRNA混合物。估计每个细胞类型在给定捕获点中的确切比例的补充方法是通过贝叶斯统计框架,将概率分布与scRNA-seq数据的基因计数分布相适应。如:Spotlight的基准策略是最彻底的:评估细胞类型检测的准确性、敏感性和特异性,以及与ground truth的总体相关性。
有许多基于富集分数的去卷积技术,例如Seurat 3.0通过从该细胞类型的基因组的平均相对表达量中减去对照基因组的平均相对表达量,计算给定捕获点的细胞类型的相对表达量分数。多模态交叉分析(MIA)根据scRNA-seq建立的细胞类型基因程序和根据空间条形码数据建立的组织类型基因程序之间的重叠,以阐明在每个区域中某些细胞类型的富集或减少程度。
映射:以单细胞分辨率创建空间分辨率的细胞类型映射。就像去卷积一样,绘制图谱的第一步是基于scRNA-seq数据建立细胞亚型。然后,映射的主要挑战是将基于scRNA-seq的细胞类型从HPRI数据分配到每个细胞上。对14种已发表的算法进行系统评估,这些算法通过基于聚类的分析实现了映射的批量校正策略,确定了三种最有效地将scRNA-seq数据与单细胞分辨率空间数据集成的算法:LIGER、Seurat Integration(来自Seurat 3.0)和Harmony。这三种算法最终都是使用不同的方法将聚类集成到低维空间中,通过对聚类的群体检测得到细胞类型2。
三、Cell2location介绍
下面我就来具体介绍Cell2location这项整合方法。为什么选择这个方法呢?因为我觉得这个方法有潜力,作者通过比较当前其他主流的方法,证明Cell2location方法在绘制细粒度细胞类型上具有优势。简单来说fine-grained指的就是细粒度,fine-grained classification是细粒度的图像分类。与之相对应的是coarse-grained classification(粗粒度)。我举个栗子。粗粒度就是可以在水果中分辨这是苹果,但是细粒度可以分辨这是哪一种苹果。
首先,因为基于阵列的mRNA捕获目前与组织中的细胞边界不匹配。因此,每个空间位置对应于几种细胞类型或多种细胞类型的不同部分。其次,空间RNA-Seq测量因不同的变异源而混乱。因为
1)不同组织位置的细胞数量不同。
2)不同细胞和细胞类型的总mRNA含量不同。
3)薄组织切片捕获每个细胞体积的不同部分。
计算方法需要对所有这些因素进行适当的建模和考虑。在这里,作者介绍了cell2location,一个原则性和通用性强的贝叶斯模型,用于在空间转录数据中全面绘制细胞类型图。Cell2location通过整合来自特定组织的单细胞或细胞核RNA-seq和空间转录数据来绘制细胞类型的空间分布图。
本篇文章3发表在期刊: Nature Biotechnology 该期刊在最近一年的影响因子: 54.908,水平很高。
Cell2location工作流程的第一步是根据单细胞和单核RAN-seq图谱估计参考细胞类型签名。
在第二步中,cell2location使用这些参考签名和一个或多个空间转录数据集作为输入,将各个空间位置的mRNA计数分解为参考细胞类型
Cell2location软件在计算上和识别位于同一位置的细胞类型上是高效的,并且与scvi-tools框架集成在一起,并附带一套下游分析工具。为了验证Cell2location,作者最初考虑了生成的模拟数据,这些数据反映了ubiquitous、regional细胞类型之间的不同细胞丰度模式。然后,作者使用Cell2location来估计各个位置不同细胞类型的细胞类型比例。将这些估计值与模拟的细胞类型比例进行比较。结果显示,无论细胞丰度模式如何,Cell2location都能高精度地绘制细胞类型,包括低丰度和区域性细胞类型。接下来,作者将Cell2location与最近提出的从空间转录数据中估计相对细胞类型丰度的方法进行了比较(Stereoscope, Seurat, RCTD, NNLS(AutoGeneS) 和 SpotLIGHT)。在考虑的细胞丰度模式中,作者发现Cell2location比其他方法能更准确地估计不同位置的细胞类型比例4。
作者首先将该模型应用于来自小鼠大脑的数据,其特征是不同类型的神经细胞在大脑区域之间组织成具有良好特征的空间结构,从而是测试空间基因组学的典型用例。作者从端脑和间脑多个区域的相邻小鼠脑切片中生成了匹配的单核(sn)和空间RNA-seq图谱。为了评估空间图谱中的生物学和器官内技术差异,作者分析了两个小鼠大脑的连续组织切片(两个来自两个动物的匹配切片,以及一个额外的snRNA-seq切片),创建了一个丰富的转录数据集。在这些细胞中,44个簇被识别为大脑中预期的细胞类型,包括星形胶质细胞、兴奋性或抑制性神经元或胶质细胞亚型。作者应用cell2location将这些细胞类型绘制到小鼠大脑的空间位置。由此得到的细胞类型图谱与先前文献中预期的解剖位置明显一致。并且,作者的结果捕捉到了不同的细胞类型,分辨了广泛的区域性细胞类型,如丘脑的兴奋性神经元、白质的少突胶质细胞,皮质中间神经元等罕见亚型以及次区域亚型,如跨皮层的兴奋性神经元。在相邻的组织切片和复制动物之间,细胞类型丰度的估计高度一致。接下来,为了评估Cell2Location方法与其他方法的特异性,作者绘制了一个现有的大型scRAN-seq数据集,其中包括来自多个脑区的细胞类型。
当作者将这些细胞类型映射到躯体感觉(SSp)皮层数据时,作者预计阴性细胞类型被排除在外,只有阳性细胞类型被分配了相当大的细胞类型比例。结果证明,与阳性细胞类型相比,Cell2Location给出的阴性细胞比例要低得多。相比之下,其他方法显得比较弱。这表明cell2location准确地排除了不应该出现在空间数据集中的参考单元类型。最后,为了展示cell2location在空间转录技术中的多功能性,作者将鼠脑snRNA-seq参考映射到(10-µm空间分辨率)Slide-seq数据集。Cell2location在Slide-Seq空间数据中解析细胞类型,包括跨越海马分区和皮质层的精细解剖亚型。
总而言之,作者的结果表明,Cell2location在描绘不同的脑细胞类型上具有很高的准确性和重复性,并且该方法广泛适用于空间转录技术。
与小鼠脑不同,人类淋巴结的特征是动态的微环境,有许多空间上相互交错的细胞群体。作者分析了来自10x Genomics公开的人类淋巴结的空间数据集,并通过整合来73,260个细胞组成的人类次级淋巴器官的scRNA-seq数据集,绘制了包含34种参考细胞类型的综合图谱。淋巴结标本的组织学检查显示有多个生发中心(GC)。相应地,用Cell2location后,可以很容易地识别淋巴结组织中预期的主要区域,包括T细胞区和B细胞区,以及带有滤泡树突状细胞((FDCs)的生发中心(GC)。作者对来自Cell2location的细胞类型丰度估计进行了非负矩阵分解(NMF)。作者观察到,NMF鉴定的细胞类型组与已知的功能相关的淋巴结细胞隔间相对应。综上所述,作者的结果表明,cell2location可以定位以空间交错的细胞类型为特征的复杂组织。
三、cell2location用来绘制精细免疫细胞
细胞图谱研究极大地扩展了人体组织中细粒度细胞类型的目录,这通常是理解组织功能和病理学的关键兴趣。作者考虑了两种人体组织中的免疫细胞群,在这两种组织中可以识别出许多具有特殊免疫功能的优良亚型。最初,作者检查了人体淋巴结中GC特异性免疫细胞类型。作者利用Visium组织学图像对GC的解剖位置进行了注释,并评估了将六种GC细胞类型映射到预期GC位置的准确性。尽管所有方法对于映射不同的细胞类型(如FDC)都达到了很高的精度,Cell2location在定位细粒度细胞类型(如GC T滤泡辅助细胞)方面明显更准确(图3)。
作者还检查了人类肠道中的免疫细胞群。人类肠道为空间图谱提供了一个极具挑战性的应用,因为它包含了大量转录上细粒度的免疫和非免疫细胞类型,免疫细胞在相对较小的淋巴滤泡的组织区域中富集。作者通过结合儿童和成人肠道的scRNA-seq数据集定义了全面的细胞类型参考特征,该数据集富含免疫(CD45+)细胞和同等比例的非免疫(CD45−)亚型,总共跨越153,901个细胞的76种细胞类型。作者将这些参考细胞类型映射到两个成人结肠的空间数据集,在该数据集中,作者使用组织学和Visium数据中的标记基因表达来注释淋巴滤泡的位置。相应地,在用Cell2location后,可以很容易地识别出结肠内预期的主要区域。同上,尽管其他的方法对于不同的细胞类型,如循环B细胞,都达到了很高的精度,但细胞定位在绘制细粒度细胞类型方面再次获得了明显更高的精度。其他的方法要么无法定位几种细致的免疫细胞类型,如Viium数据中的FCRL4+记忆B细胞和Tfh细胞,要么映射它们的特异性较低。综上所述,这些结果表明,在绘制复杂组织中转录细粒细胞类型的图谱方面,cell2location优于其他方法。
四、小编总结:
基于单细胞组学在近三年发展起来的新兴领域,“单细胞多组学技术”和“空间转录组技术”先后在2019年和2020年被Nature Methods评为年度技术方法。时间和空间维度多维研究技术结合,将以全新研究思路出发,既能够获得单个细胞间异质性,又能获得细胞在组织空间上的结构位置信息,发现更多未知且精细化结果。总而言之,单细胞测序+空间转录组测序:优势互补,同时获得细胞类型群体,以及基因表达和细胞的空间位置信息。如果喜欢本文就mark一下“在看”,顺便给小编一个赞吧~
参考文献
1. Moncada R, Barkley D, Wagner F, et al. Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas. Nat Biotechnol. 2020;38(3):333-342.
2. Longo SK, Guo MG, Ji AL, et al. Integrating single-cell and spatial transcriptomics to elucidate intercellular tissue dynamics. Nat Rev Genet. 2021;22(10):627-644.
3. Kleshchevnikov V, Shmatko A, Dann E, et al. Cell2location maps fine-grained cell types in spatial transcriptomics. Nat Biotechnol. 2022.
4. Kleshchevnikov V, Shmatko A, Dann E, et al. Comprehensive mapping of tissue cell architecture via integrated single cell and spatial transcriptomics. bioRxiv. 2020:2020.2011.2015.378125.