Integrated single-cell genetic and transcriptionalanalysis suggests
novel drivers of chroniclymphocytic leukemia(GR)
通过对包括慢性淋巴细胞白血病(CLL)在内的大量肿瘤进行基因组测序,可以发现肿瘤内部的遗传异质性。虽然大量DNA水平的数据为克隆异质性的特征化提供了一个框架,但癌细胞的表型无疑受到基因组成和基因表达的双重控制,因此,理解这种关系要求在单细胞水平上整合基因和转录信息。今天这篇文章中研究人员为了更准确地对CLL进行亚克隆鉴定、确定系统发育关系和基因型与表型的关系,他们开发了从5个CLL样本的数千个单细胞中检测DNA和RNA的靶向突变的方法。通过明确系统发育关系,研究人员鉴定出突变的 LCP1和WNK1作为新的CLL驱动因子,并证明它们对CLL通路具有影响。对具有转录状态的基因体细胞突变的综合分析提示了这样一种观点:趋同进化在不同的遗传分支中产生表型相似的细胞,从而在每个CLL样本中产生一个cohesive expression profile(尽管存在遗传异质性)。本研究使用三种实验方法:靶向DNA、全转录组和靶向RNA对一系列CLL样本进行了测序,用于在单细胞水平研究亚克隆结构与表型之间的关系(图1A)。
采用单细胞靶向DNA测序技术,对5个CLL样品进行克隆结构鉴定。5例标本中有4例检测到del(13q),2例检测到del(17p),3例检测到del(11q)(图1 B)。在所有5个样本中,单个细胞包含的遗传变异比例与肿瘤细胞比例(CCF)高度一致(图1C)。
为了发现不同亚群之间的关系,研究人员进行了聚类分析和系统发育重建,其中4个样品表现出分支进化,只有CLL032表现出线性进化结构。对于CLL003,大多数体细胞突变是克隆型的,包括del(13q)等 ,其中有一个包含130个细胞的亚克隆含有MYH1突变。在这个亚克隆中,55个细胞中有del(17p)(该区域包含TP53)。从MYH1亚克隆中分离出来的24个细胞具有TP53突变。之后研究人员还用荧光原位杂交技术(FISH)确定了这些亚群的相对比例(图2A)。CLL146单细胞DNA测序结果显示,在一个有55个细胞(40%)的子克隆中,有一个分支中含有三个sCNAs (del(6p)、del(17p)和del(18p)),并得到FISH验证 (图2B)。另一个分支(60%)在WNK1 (V430F)发生突变。del(13q)是CLL中常见的早期事件,但在CLL005中是del(13q)该患者的亚克隆事件,并与del(11q)和MTOR突变同时发生(图2C)。在CLL096中,没有分析拷贝数变化,但是根据sSNV定义了四个亚克隆,其中一个具有已知的CLL驱动基因SF3B1突变。
对5个CLL样本中的4个(每个样本96个细胞)进行单细胞全转录组测序,其中有289个细胞通过质控。平均每个细胞测3,781,092条reads(范围为664,548-6,889,700),平均每个细胞检测到2473个转录本(范围为1741-4255)。研究人员使用PAGODA(路径和基因集过度分散分析)方法在已知的重要信号通路基础上对细胞进行降维及分类,用来研究细胞间的变异性。对于每个样本,通过PAGODA表征转录异质性细胞的转录状态反映了多种细胞过程,如细胞周期和免疫信号等(图3A,B)。为了将基因型和表型联系起来,研究人员试图在单细胞RNA-seq数据中识别先前的DNA分析中鉴定出的基因突变(WNK1, MTOR, LCP1, PURG, SF3B1)。然而在RNA-seq数据中这些基因位点未覆盖到。因此,尽管单细胞RNA-seq基于通路驱动的基因表达分析可以确定转录异质性,但这些数据不能可靠地解析遗传亚克隆结构或评估遗传结构与转录异质性的对应关系。
整合单细胞靶向基因表达和突变检测具有鲁棒性和敏感性单细胞RNA-seq数据的稀疏性促使研究人员开发了一种靶向RNA方法来评估同一单细胞的转录和突变状态。该方法在7个CLL样本中进行了测试,包括上面分析的5个。在RNA表达方面,对每个细胞的96个基因进行qPCR检测。随着每个样本的细胞数目减少,检测到的基因数量随之减少。从7个CLL样本和正常CD19+ B细胞中各提取384个单细胞进行分析,发现管家基因ACTB和B2M在1951个细胞(92.4%)中表达稳定。在组织中高表达的基因R在单细胞中始终高度表达(图4B),然而,在组织中表达较低的基因在单细胞中表现为双峰表达。许多单细胞表达量高,而另一些细胞表达量低或未检测到。同时,利用qPCR对相同单细胞的sSNVs和SNPs进行配对分析 (图4D)。在CLL样本中,野生型等位基因很容易从突变等位基因中分离出来。突变等位基因始终存在于原发患者中,但不存在于非白血病B细胞中(图4E,F)。
利用单细胞RNA数据进行系统发育重建与趋同进化推断研究人员从高表达基因和以前确定的候选缺失区域中选择基因进行SNP检测(图5A,B),基于RNA的等位频率估计和基因靶向DNA的体细胞突变频率估计及肿瘤细胞比例具有高度一致性(图5C)。这样研究人员就可以利用RNA数据重建系统发育(像之前基于DNA的分析方式)。对来自CLL005的316个单细胞的分析表明,CLL005中存在两个亚群:细胞亚群1(11q和13q染色体缺失和IFNAR2突变共发生)和亚群2 (LCP1发生突变) (图5D)。而且研究人员还发现缺失区域内,含有缺失的单细胞的基因表达量始终较低(图5E,F)。】
在CLL005中,一个亚克隆分支具有已知的驱动因子del(13q)和del(11q),del(13q)包含MIR15-16位点,在小鼠模型中,MIR15-16位点的敲除加速了细胞周期, del(11q)中包括 ATM。另一个分支在LCP1中有一个截断突变,该基因也对CLL的发生发展具有重要作用。随后研究人员构建表达野生型或截断型LCP1的细胞系(图6A,B),发现突变的LCP1的表达不影响细胞生长速度,但会导致DNA损伤反应的改变。免疫沉淀法检测到ATM与野生型LCP1以及截断的LCP1之间存在直接的物理相互作用(图6C)。最后,与野生型表达LCP1的细胞相比,即使存在ATM抑制剂,LCP1突变细胞在伽玛射线照射下的存活率也更高(图6D)。总之,这些结果表明LCP1突变对DNA损伤具有抵抗力。对于CLL146, WNK1-V403F突变存在于一个不同于携带多个染色体畸变的亚克隆(6p、17p和18p)的亚克隆中。WNK1是丝氨酸/苏氨酸蛋白激酶的WNK亚家族成员,基于晶体结构,WNK1-V403F定位于WNK1激酶的催化域,并与临界t环区域发生物理作用(图6E)。为了探讨这种突变对哺乳动物细胞的影响,研究人员在HEK293细胞中敲除内源性WNK1,然后引入野生型和突变型WNK1,观察到WNK1-V403F突变细胞从G1期快速过渡到S期,表明突变有利于细胞增殖和生长(图6F)。
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史
