人类癌症中snoRNAs的遗传和药物基因组学研究
生信干货
Leyla ·2020年9月2日 22:15
今天跟大家分享的是六月份发表在Molecular Cancer杂志(IF:15.302)上的一篇文章The genetic and pharmacogenomic landscape of snoRNAs in human cancer,本工作分析了29种癌症型中遗传变异对snoRNAs的影响,进一步将相关等位基因与患者生存以及全基因组关联研究风险位点联系起来。此外还分析了snoRNAs表达对患者药物反应的影响。本工作开发数据资源GPSno,使研究人员可以可视化、浏览和下载多维snoRNAs相关数据。本工作提供了snoRNAs的全面的遗传和药物基因组学概况。
The genetic and pharmacogenomic landscape of 小核仁RNA (Small nucleolar RNAs,snoRNAs)是一组调控RNA,主要存在于核仁中并在转录后修饰核糖体RNA (ribosomal RNA,rRNA)和小核RNA (Small nuclear RNA,简称snRNA)。新的证据表明,snoRNAs在癌症中发挥着重要作用。小核仁RNAs(snoRNAs)在肿瘤发生中的重要作用。然而,snoRNAs的遗传和药物基因组图谱尚不明确。利用来自TCGA的基因型和snoRNAs表达数据,本工作分析了29种癌症类型中遗传变异对snoRNAs的影响,并进一步将相关等位基因与患者生存以及全基因组关联研究风险位点联系起来。此外,本工作分析了snoRNAs表达对患者药物反应的影响,以促进snoRNAs在癌症中的临床应用。本工作还开发了一个数据资源,GPSno(http://hanlab.uth.edu/GPSno),具有多个模块,使研究人员可以可视化、浏览和下载多维数据。本工作研究提供了snoRNAs的全面的遗传和药物基因组学概况,为开发基于snoRNAs的靶向治疗提供未来临床考虑。GDC portal(https://portal.gdc.cancer.gov/)下载泛癌样本的基因型和miRNAseq数据。本研究中产生的所有结果都可以在GPSno(http://hanlab.uth.edu/GPSno)数据库中找到。为了全面研究遗传变异对不同癌症类型中snoRNA表达的影响,本工作对29种癌症类型进行了snoRNA表达数量性状基因位点(QTL)分析,其中至少50例患者在TCGA中同时具有基因型数据和snoRNA表达数据。研究共纳入9449例肿瘤样本,每种癌症类型的样本量从56例(子宫癌肉瘤,UCS)到1073例(乳腺浸润性癌,BRCA)不等(图1a)。然后对基因型数据进行填充和质量控制。平均每种癌型有435个snoRNAs。接下来分析了近端基因调控snoRNA (SNP距离snoRNA位置小于1 Mb),在29癌型中总共69557个显著SNP-snoRNA对,FDR < 0.05(图1a)。例如,在胰腺腺癌(PAAD)中,rs6483262等位基因对SNORA25的表达具有显著调控作用(图1b),SNORA25之前被报道为胰腺癌早期检测的一个有前景的生物标志物。接下来研究了cis-snoQTLs在成对snoRNAs中的相对位置分布,发现cis-snoQTLs优先位于成对snoRNAs的附近(图1c)。为了分析snoRNA的远端基因调控(SNP距离snoRNA位置超过1 Mb),在29种癌症类型中识别了34151对SNP - snoRNA(图1a)。如rs8069739等位基因在肺腺癌(LUAD)中对U8的表达进行了远程调控(图1d),据报道,U8损耗在肺腺癌中触发了一种非常有效的p53依赖的抗肿瘤应激反应。cis-snoQTLs和trans-snoQTLs的数量与样本数量均显著相关。这表明,在某些类型的癌症中,由于样本量不足,一些SNP的影响可能被低估,这可以在未来通过增加患者样本得到改善。为了研究这些与snoRNA表达相关的遗传变异的临床相关性,在不同癌症类型中,识别了475个与患者的总生存相关的SNP等位基因。如携带纯合子rs1694419 AA的肾透明细胞癌(KIRC)患者的总生存率较携带杂合子AA和纯合子AA的患者差(图1e)。携带纯合子rs1694419 AA的患者,其SNORD45B的表达水平明显高于携带杂合子的患者。与相邻正常组织相比,在KIRC肿瘤组织中,SNORD45B明显上调,与低表达SNORD45B的KIRC患者相比,高表达SNORD45B的KIRC患者的总体生存也较差。综上,证明了snoQTLs通过调节snoRNAs的表达对患者生存的影响。为了识别全基因组关联研究(genome-wide association study,GWAS)相关的snoQTLs,从GWAS目录中提取了28345个与性状/疾病相关的SNPs ,得到了位于GWAS连锁不平衡(LD)区域的1167961个SNPs。本工作识别了29795对snoQTL-snoRNA,其中snoQTLs与不同癌症类型中已知的疾病/特征相关基因座存在重叠。例如,Testicular Cancer Consortium的研究发现rs60180747与睾丸生殖细胞肿瘤(TGCT)风险显著相关。SNP marker rs60180747标记15q22.31上的一个261 kb 单倍型块,该单倍型块包含几个基因,包括TIPIN、MAP 2 K1、DIS3L、SNAPC5、RPL4和ZWILCH(图1f),rs60180747位于基因TIPIN的内含子上。然而,在TGCT患者的15q22.31中,该风险等位基因与任何蛋白质编码基因均无相关性。接下来进一步检测了附近的SNPs,发现rs12905354与rs60180747在LD中,与SNORD18A的表达显著相关,而不是位于这个风险位点的蛋白质编码基因。这些发现表明,SNORD18A可能是TGCT GWAS位点中的一个causal target。
2. 不同癌型中的snoRNAs的药物基因组学景观接下来分析了snoRNA表达对药物应答的影响,评估TCGA患者中snoRNA表达差异与抗肿瘤药物应答之间的关系。从以前的研究中获得了TCGA患者的估算药物反应数据,纳入18个TCGA肿瘤类型,至少50例患者同时有估算药物反应数据和snoRNA表达数据,进行药物反应分析。在18种癌症类型中,发现FDR < 0.05显著相关的snoRNA -drug对有16393对(图2a)。snoRNA-drug对数量与样本数量无相关性。这些snoRNAs(390个box C/D snoRNAs、184个box H/ACA snoRNAs和27个scaRNAs)在不同癌症类型的不同药物靶点通路中对患者对药物的反应具有广泛影响。在这些药物靶点通路中,与细胞骨架通路相关的药物中snoRNA-drug对数量最多(图2b)。然后进一步使用Fisher’s exact test评估了10种癌症类型中每个药物靶点通路的富集情况,发现至少有100对显著相关的snoRNA-drug响应对,细胞骨架通路在5种癌症类型中显著富集(图2c)。以前列腺腺癌(PRAD)为例,29种抗癌药物的应答与至少5种snoRNAs水平显著相关(图2d)。不同的snoRNAs在对某一药物的反应中表现出积极或消极的一致性,这可能是由于这些snoRNAs在每种癌症类型中的表达高度相关。在PAAD患者中,SNORA23表达水平与药物阿西替尼的反应高度相关(图2e)。SNORA23已被证实可促进胰腺癌的肿瘤生长和转移。因此,在未来的阿西替尼临床试验中,可能需要考虑SNORA23的表达水平。这些结果表明,可评估水平的snoRNAs可能有助于药物治疗的反应。需要进一步的实验来验证药物对这些snoRNAs的反应效果。
3.一个全面的数据资源GPSno以探索snoRNAs在癌症中的遗传影响和药物基因组景观本工作开发了一个用户友好的数据资源GPSno(https://hanlab.uth.edu/GPSno/),便于生物医学研究对数据进行可视化、搜索和浏览。GPSno包含五个主要模块:cis-snoQTLs、trans-snoQTLs、survival-snoQTLs、GWAS-snoQTLs和药物反应(图3a)。为了便于查询提供了几个入口通道,如癌症类型、SNP ID和snoRNA ID。用户可以进入不同的页面检索感兴趣的snp或snoRNAs,还可以根据癌型、SNP ID或snoRNA进行检索(图3b)。在cis/transsnoQTL页面查询,会返回一个包含SNP ID、SNP基因组位置、SNP等位基因、snoRNA ID、snoRNA位置、beta值(SNP对基因表达的影响大小)和snoQTL P值的表格(3c)。对于每条记录,都提供了箱线图的矢量图,以显示SNP基因型和snoRNA水平之间的关联。在survival- snoQTL页面查询,可以显示不同基因型的SNP ID、SNP基因组位置、SNP等位基因、log-rank检验P值和中位生存时间的详细信息,同时提供Kaplan-Meier生存曲线图。在GWAS- snoQTLs页面上查询将返回SNP信息、snoRNA信息和相关的GWAS特征。在药物反应页面上查询将返回snoRNA和相关药物信息,还提供了一个图表来显示snoRNA水平和药物反应之间的关联。为了方便研究人员研究不同类型的癌症,还设计了一个癌症类型特定模块来查询结果(图3d)。查询结果表可以下载XLSX格式,结果图可以下载PDF格式。该数据库将为未来的实验选择候选snoRNAs提供独特的资源。
小核仁RNAs(snoRNAs)在肿瘤发生中有重要作用。本工作分析了29种癌症类型中遗传变异对snoRNAs的影响,分析了近端与远端SNP-snoRNA对,并进一步将相关等位基因与患者生存以及全基因组关联研究风险位点联系起来。然后还分析了snoRNAs表达对患者药物反应的影响,发现与细胞骨架通路相关的药物中snoRNA-drug对数量最多。本工作还开发了一个数据资源,GPSno(http://hanlab.uth.edu/GPSno),提供cis-snoQTLs、trans-snoQTLs、survival-snoQTLs、GWAS-snoQTLs和药物反应相关数据,还提供可视化图表。可以看到这篇工作的亮点就是从小核仁RNAs角度出发进行研究,以及构建数据库提供数据资源。后面的药物分析还是很常见的,其实大家也可以考虑是否从小核仁RNAs角度可以进行其他生信相关分析呢~