单细胞外显子测序和JAK2阴性骨髓增生性肿瘤的单克隆进化
Single-Cell Exome Sequencing andMonoclonal Evolution
of a JAK2-NegativeMyeloproliferative Neoplasm(cell)
文章主要内容
这篇文章描述了一种在单细胞核苷酸水平上分析癌症基因组的方法。研究人员首先利用两个淋巴母细胞样细胞系单细胞设计并验证了一个高通量的全基因组单细胞测序方法。然后,对一名JAK2阴性的骨髓增生性肿瘤患者的90个细胞进行了全外显子单细胞测序。其中58个细胞的测序数据通过质控,这些细胞测序数据分析表明该肿瘤为单克隆进化。并且进一步确定了血小板增多症(ET)相关的候选突变,如SESN2和NTRK1,这可能参与肿瘤进展。这项初步研究允许在单细胞核苷酸水平上对疾病相关的遗传结构进行初步描述。
在通读这篇文章结论前,补充两个知识点~
(1)肿瘤进化是癌症研究中的一个重要领域,因为关于肿瘤发展过程中发生的基因变化信息对于有效的诊断、预后和治疗至关重要。目前的理论认为肿瘤是由单克隆或多克隆体细胞突变引起的,有证据支持基因组的渐进变化和瞬时变化会促进肿瘤进展。然而,肿瘤的异质性使得研究人员很难分析肿瘤内的遗传结构,尤其是造血肿瘤具有高度异质性,这使得识别对造血肿瘤发展有重大影响的基因突变变得特别困难。
(2)骨髓增生性肿瘤是一种造血肿瘤。它们起源于造血干细胞或祖细胞的遗传变异,导致异常分化和骨髓生成。典型的骨髓增生性肿瘤是原发性血小板增多症(ET)。ET的特征是恶性髓样和巨核细胞的持续增殖,这导致循环血小板数量增加,通常超过600*109/l。ET每年发病率约为1/50000,近年来发病率不断上升。大约55%的ET患者携带JAK2突变。然而,JAK2和其他罕见的突变可以在ET和其他类型的骨髓增生性肿瘤中发现。因此这些突变既不能提供独特的标记来推断ET的进化历史。揭示ET潜在遗传机制的一种方法是评估单个癌细胞内的突变,这样可以避免肿瘤异质性的问题。
文章主要结论包括两部分:
(1)全基因组单细胞测序方法的建立及质量评估;
(2)JAK2阴性的骨髓增生性肿瘤患者的单克隆进化分析。
以下为具体分析结果:
全基因组单细胞测序方法及质量评估
为了开发和测试一种在单核苷酸水平上进行全基因组单细胞测序的方法,研究人员构建了一个淋巴母细胞样细胞系,该细胞系来自第一个为亚洲二倍体基因组序列提供DNA的个体(YH)。在倒置显微镜下,通过级联稀释,研究人员使用标准操作方法从YH淋巴母细胞系中随机提取两个单细胞(以下称为YH-1和YH-2)。然后对每个单细胞的DNA进行基于多重置换扩增(MDA)的全基因组扩增(WGA)。进一步使用基于DNA荧光定量的方法来选择定量合格的产品,并且用10个家系基因PCR检测每个单细胞的基因组完整性。最后对两个细胞的基因组进行100bp双端测序,使用SOAP软件将42.27 Gb (YH-1)和47.65 Gb (YH-2)高质量序列唯一地映射到人类参考基因组(Hg18) 。YH-1比对率为 97.25% ,深度为15.88,意YH-2比对率为95.64,深度为17.90。研究人员同时还直接对该细胞系进行了全基因组测序作为对照组(比对率99.91%,深度~18x)。
接下来研究人员对测序数据的覆盖度,扩增均一性等指标进行比较分析。YH-1和YH-2测序数据覆盖度>90%,并且不同基因中区域扩增效率主要与GC含量相关。
等位基因缺失(ADO)和假阳性率会影响单细胞测序的敏感性。YH-1和YH-2的平均ADO比率为11%,与其他文献结果一致,表明单细胞序列质量合格。为了进一步确定单细胞测序的特异性和保真度,研究人员还评估了假阳性率,YH-1和YH-2的平均假阳性率低至2.52*10-5。
等位基因丢失和假阳性率与基因组区域或碱基类型无关
为了评估ADO和假阳性位点对序列的影响,研究人员分析了这些错误碱基相对于基因组区域和碱基类型的分布。通过分析1号染色体上的分布,除了端粒和着丝粒附近的区域外,ADO和假阳性位点的分布是均匀的(图2A),这表明碱基错误是随机发生的。并且研究人员还发现四种基本碱基的ADO数之间没有显著差异(Fisher 's exact test, p = 0.3)。假阳性位点显示出对C:G到T: A变化的偏好(Fisher 's exact test, p < 0.01)(图2C),这也符合细胞分裂过程中发生转移比转位更容易的预期。这些数据表明,碱基错误率对通过单细胞测序在ET中看到的突变模式产生非常有限的人为影响。
WGA错误不会选择性地影响具有特定生物学功能的基因
研究人员进一步评估了在单细胞测序数据中没有充分覆盖的基因组区域是否可能影响分析。通过对扩增失败的区域中640个基因进行GO分析,发现这些基因没有富集到任何一种特定的生物学功能 (图2E)。综上表明该单细胞测序策略具有较高的敏感性和特异性,可用于进行准确的遗传分析。
JAK2阴性ET患者的单细胞外显子组测序
基于以上单细胞测序方法,研究人员从一位JAK2阴性ET患者新鲜骨髓样本中随机抽取82个细胞,通过显微操作从正常口腔粘膜上皮样本中随机抽取8个细胞,进行了测序。在这里,为了更经济节约,研究人员采用了外显子组测序策略,来评估单个细胞编码区域内的遗传变异。
在ET单细胞研究中,研究人员平均对每个细胞(共90个细胞)的37Mb靶向外显子区进行测序,平均深度为30x,其中58个细胞覆盖度大于70%,用于后续分析。研究人员还对多细胞样本进行了外显子测序作为对照组(骨髓样本:深度91x,口腔粘膜样本:58 x)。
患者的体细胞突变分析和验证
研究人员使用SOAPsnp检测所有样本的SNP,然后进行ADO和假阳性率分析,平均ADO为43.09%,假阳性率为6.04*10-5。这里观察到的较高的ADO和假发现率可能是由于细胞状态和细胞模式的差异,以及在外显子组捕获步骤中杂合性的丢失。
为了检测高置信度的体细胞突变,这里要求在至少5个ET细胞中存在体细胞突变,并且在口腔粘膜上皮组织序列数据中纯合的位点被认为是真实的体细胞突变位点。最后在外显体和侧翼区域(100 bp以内)共鉴定了712个体细胞突变。
之后研究人员用两种方法验证了来自单细胞测序的体细胞突变。首先,将所有单细胞测序的体细胞突变与ET组织测序中发现的突变进行比较。单细胞测序与组织测序的体细胞突变等位基因频率相关系数(R2)为0.75,频率高度一致(图3D)。其次,随机选择30个体细胞突变利用PCR-Sanger评估52个随机选择的细胞中是否存在该突变,检出一致性90%(30个位点中有27个检出)。
群体遗传模式显示ET细胞的单克隆起源
考虑到在分离ET细胞的过程中偶然收集到正常细胞的可能性,研究人员基于体细胞突变进行主成分分析(PCA) (图4A),第一个成分(特征向量1)表明ET细胞与口腔上皮细胞(组织测序)存在明显差异,表明没有明显的正常细胞与ET细胞混合。同时还观察到,在每个特征向量上,ET细胞也彼此分离,表明ET细胞具有丰富的遗传多样性。然而,我们没有在每个特征向量上检测到ET细胞之间的任何显著子簇,这表明ET细胞可能是单克隆起源的。
为了充分利用单细胞测序数据重建肿瘤内基因组结构并推断可能的发育模式,研究人员检测了ET细胞的体细胞突变等位基因频谱(SMAFS)。研究人员使用基于贝叶斯估计的方法计算所有ET细胞每个位点的体细胞等位基因频率。研究人员并没有观察到明显的选择信号(图4B),因为在最低或最高体细胞突变等位基因频率下,非同义SNPs并不比同义SNPs多。SMAFS 图谱还显示突变频率在50%左右的突变位点有明显增加,这说明所有的单细胞都含有特定的杂合体细胞突变等位基因,或者有一半的单细胞含有纯合体细胞突变等位基因(但这是极不可能的)。因此,该患者的ET极有可能起源于一个克隆,或由一个克隆扩增而来。这也并不排除其他克隆来源的细胞数量极低的可能性。
为了提供进一步的单克隆起源的遗传证据,我们通过计算机模拟这些ET细胞发生单克隆进化的可能性。在模拟过程中,研究人员发现单克隆模拟(单克隆进化)与本研究得到的SMAFS分布最为相似(图4C)。综上所述,这些数据表明该肿瘤极有可能是单克隆进化模式。
突变基因及其在ET单克隆进展中的潜在作用
为了鉴定ET单克隆起始和进展的关键基因,研究人员进行了一系列分析,通过评估712个体细胞突变中的171个突变发现,有78个是非同义突变,并且存在于71个基因中。使用SIFT分析发现其中15个基因可能含有破坏蛋白质结构的突变,还发现这71个基因中有3个(MLL3、NTRK1和PDE4DIP)存在于COSMIC数据库中。
进一步使用改进的泊松模型评估这18个基因对ET发展的重要性,最后确定8个基因(Qscore>=1)对蛋白功能影响更大,这些基因可能对未来有关ET的生物学研究非常重要。
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史