A Comprehensive Bioinformatics Analysis of Notch Pathways in Bladder Cancer
膀胱癌Notch通路的生物信息学分析
今天分享一篇,在2021年5月份发表在cancers (IF: 6.999)上关于利用公共表达数据探究Notch通路在膀胱癌的作用的文章。
Simple Summary
Notch通路在胚胎学和许多肿瘤疾病中具有重要意义。然而,其在膀胱癌(BCa)中的作用迄今尚未得到深入研究。通过生物信息学分析现有的膀胱癌表达数据,有助于探索Notch通路对膀胱癌的影响。利用这些信息可以探究膀胱癌发生的原因,同时找到用于预测疾病预后情况的生物标志物。分析证实,Notch受体NOTCH2/3和其配体DLL4 能够直接作用于基本的细胞功能同时调节免疫反应,因此可以作为膀胱癌的潜在驱动因子。
背景:Notch信号通路的一个特征是其在肿瘤生物中的可变性,例如从抑癌作用到致癌作用。目前,Notch信号通路在膀胱癌中的作用尚不清楚。
方法:从GTEx and TCGA-BLCA这两个数据库获取数据,根据Notch受体、配体和下游基因的RNA表达水平,探讨经典Notch通路在BCa中的作用。对于癌症和非癌症样本的统计分析,我们使用R软件包和公共数据库/网络服务器。
结果:所有 Notch受体(NOTCH1,2,3,4),delta类Notch配体(DLL1,3,4),以及经典的下游调节基因hairy 和 enhancer of split 1 (HES1),在对照组和膀胱癌中的表达情况均有差异。NOTCH2/3受体的高表达水平与较差的总生存率(OS)和较短的无病生存率(DFS)相关。然而,在长期(>8年)随访中,NOTCH2表达与更好的总生存率(OS)和无病生存率(DFS)相关。此外,DLL4表达高的病例与差的总生存率(OS)相关但与无病生存率(DFS)的提高有关。通路网络分析显示,NOTCH2/3与细胞周期、上皮-间充质转化(EMT)、淋巴细胞亚型数量以及免疫系统调节密切相关。
结论:NOTCH2/3和DLL4是BCa中Notch信号转导的潜在驱动因素,提示Notch及其相关通路通过直接调节免疫细胞或与细胞周期和EMT相互作用在BCa的进展和预后中起重要作用。
关键词:Notch通路;生物信息学分析;膀胱癌;预后;免疫系统调节
Introduction
Notch信号通路是一种高度保守的配体-受体信号通路,参与肿瘤生物学的各个方面,在肿瘤干细胞、血管生成、上皮-间充质转化(EMT)、肿瘤免疫和耐药性等方面发挥着重要作用。近年来,Notch通路在膀胱癌(BCa)的进展和预后中受到了重视。然而,文献结果却有很大的不同。Hayashi等人认为NOTCH2是致癌基因,其高表达和拷贝数增多会促进膀胱癌的进展。相反,Greife等人发现NOTCH2在一组侵袭性膀胱癌的样本中其mRNA表达显著下调。总的来说,文献报道的资料中对Notch信号通路在膀胱癌的作用有明显的偏差,可能是抑制作用或促进作用。因此,Notch信号通路膀胱癌的作用机制尚不清楚。
肿瘤是恶性细胞与肿瘤微环境(TME)共同进化的结果,肿瘤的进展、发展、转移、侵袭和耐药是由TME和癌细胞之间的双向相互作用调节的。免疫浸润是TME的重要组成部分,在膀胱癌的进展中起着重要作用。因此,了解调节免疫反应的基因对于了解更多关于癌细胞如何逃避或如何抑制抗肿瘤免疫反应至关重要。到目前为止,Notch信号在肿瘤微环境中的应用已经在各种癌症中得到了广泛的报道。然而,有关Notch与膀胱癌的免疫应答机制及相互作用的关系研究却很少。
各种众所周知的与癌症相关的途径都参与了癌症的发生,例如Wnt、Hedgehog、hypoxia和TGF/BMP通路,它们可能影响Notch信号。同时,一些信号通路,如雷帕霉素(TSC-mTOR)通路在膀胱癌中发挥重要的作用。
综上所述,通过分析膀胱癌 mRNA的表达水平,Notch信号中最有趣的角色是(i) Notch受体:NOTCH1, NOTCH2, NOTCH3, NOTCH4;(ii)锯齿状、典型Notch配体Jagged 1 (JAG1)和Jagged 1 (JAG2),以及delta状典型Notch配体1 (DLL1)、DLL3、DLL4;(iii)典型下游基因:hairy and enhancer of split 1 (HES1)和hairy/enhancer of split-related with YRPW motif protein 1 (HEY1)。本研究通过全面的生物信息学分析,试图阐明膀胱癌中Notch信号转导的分子机制和生物学过程,包括其对肿瘤免疫应答的可能影响以及与已知癌症相关通路的关系(图1)。
图 1
2.1 数据采集
从GTEx下载正常膀胱标本的靶基因表达数据,非癌症样本和膀胱癌样本的临床数据集以及靶基因表达(TCGA-BLCA)从TCGA下载。HTseq-count文件用于列出每个基因的唯一映射读取数。“DESeq2”R包对数据进行归一化,并对样本之间的基因表达进行批量校正,以使特征具有可比性。
2.2 不同亚组的表达水平分析
TCGA和GTEX数据集中没有细胞类型特异性表达水平; 然而,我们可以从肿瘤组织中提取基因表达谱,通过基因集变异分析(GSVA)来推断肿瘤浸润淋巴细胞(TILS)的相对丰度,从而进行淋巴细胞亚型分析。
利用以下分组进行分析:(i) 原发肿瘤,非癌标本(ii)肿瘤分期:Ⅰ期、Ⅱ期、Ⅲ期、Ⅳ期(iii)淋巴结转移:N0(无区域淋巴结转移)、N1(1 ~ 3个腋窝淋巴结转移)、N2(4 ~ 9个腋窝淋巴结转移)、N3(10个以上腋窝淋巴结转移) (iv)组织学状态:乳头状肿瘤(PT)、非乳头状肿瘤(NPT) ;(v)种族:亚洲人、黑人或非裔美国人、白种人;性别:女性vs.男性患者;(vii)分子亚型:神经元型(NET)、基底型(BT)、基底鳞状型(BST)、管腔型(LT)、管腔浸润型(LIT)、管腔乳头型(LPT) ;(viii)突变TP53, TP53非突变。我们使用R studio统计软件,包括“Bioconductor”、“tidyr”、“complexHeatmap”、“RColorBrewer”、“Biocmanager”、“circlize”和“ggplot2”软件包进行统计分析和结果可视化。UALCAN (http://ualcan.path.uab.edu作为辅助分析工具,根据分子亚型和TP53突变状态,分析不同亚组靶基因的表达水平。排除样本量<7的亚组;设置p值<0.05(具有统计学意义)。
2.3. 相关性分析及诊断价值评价
对于相关分析和相关矩阵可视化,我们使用统计软件R studio和R包“performanceAnalytics”、“Hmisc”、“pROC”和“corrplot”。 我们分析了不同靶基因之间的相关性。另外,根据肿瘤与免疫系统相互作用数据库(TISIDB;http://cis.hku.hk/TISIDB),分析了Notch成员(Notch受体和Notch配体)与淋巴细胞的相关性以及与BCa中免疫调节剂的关系。相关系数的标准定义如下:0.00–0.19(非常弱)、0.20–0.39(弱)、0.40–0.59(中等)、0.60–0.79(强)和0.80–1.0(非常强)。p值<0.05被认为具有统计学意义。我们使用(ROC)曲线来评估相关基因的诊断价值。此外,为了确定Notch信号的关键因素,我们采用了正交偏最小二乘判别分析(OPLS-DA;多元统计分析的R包“ropls”)。
2.4. 总生存率(OS)和无病生存率(DFS)分析
临床数据从TCGA-BLCA下载并使用R studio(软件包:“ComplexHeatmap”、“clusterProfiler”、“survival”、“survMisc”、“survminer”、“RColorBrewer”)进行分析。对OS和DFS进行Kaplan-Meier估计以评估靶基因的预后价值。我们使用Cox回归来寻找独立因素,landmark分析和时间依赖性协变量来评估组间交叉的预后价值。我们还用了GSCALite (http://bioinfo.life.hust.edu.cn/web/GSCALite/),一个用于基因集癌症分析的网络服务器,估计Notch成员基因的DNA甲基化对总生存率有影响。p值<0.05被认为具有统计学意义。TCGA-BLCA数据集中没有关于癌症特异性生存率的数据。
2.5. 基因-基因相互作用(PPI)网络分析和基因集富集分析(GSEA)
我们用GeneMANIA (http://genemania.org/co-expression)构建基因-基因相互作用网络(GGI), GSEA软件用于膀胱癌和非癌样本的功能分析。 此外,通过使用GSCALite(http://bioinfo.life.hust.edu.cn/web/GSCALite/),评估靶基因与其他众所周知的膀胱癌相关途径之间的关系。
2.6.目的基因身体展示图以及肿瘤分析
利用基因表达谱交互分析数据库(GEPIA, http://gepia.cancer-pku.cn;),对各种癌症和正常组织的Notch相关基因表达水平在身体图上进行展示。此外,我们还使用了Oncomine(https://www.oncomine.org),用于对目标基因进行元分析。膀胱癌和对照组织中靶基因编码的蛋白质的免疫化学(IHC)染色来自人类蛋白质图谱(HPA, http://www.proteinatlas.org/)。p值<0.05被认为具有统计学意义。
2.7. 其他统计分析
所有统计分析均采用R统计软件进行。单因素分析采用方差分析、t检验、Wilcoxon检验、Tukey的HSD和排列检验。相关分析采用Pearson检验或Spearman分析。采用主成分分析(PCA)和正交偏最小二乘判别分析(OPLS-DA)模型进行多变量分析。
从TCGA-BLCA中获得46例肿瘤标本(n=406)和19例非癌标本,从GTEx中提取21例正常膀胱标本。标准化后的数据通过质控,保证了表达水平的差异性。
3.1. 基因表达分析
3.1.1. Notch通路相关基因在膀胱癌及对照组中的表达
与对照组相比,膀胱癌样本中NOTCH1、NOTCH2、NOTCH4、DLL1和DLL4的表达水平显著下调。相反,NOTCH3、DLL3和HES1显著过表达。在对照组中,TCGA-BLCA非癌样本中的NOTCH4和DLL4显著低于GTEx正常组织中的NOTCH4和DLL4。JAG1、JAG2和HEY1没有发现显著差异(图2)。
图 2
3.1.2. 肿瘤不同阶段的基因表达
在肿瘤I期,只有两个样本可用。因此,我们在不同肿瘤分期的分析中省略了Ⅰ期。NOTCH2在Ⅱ期(S2)的表达低于Ⅲ期(S3)和Ⅳ期(S4);S2组JAG2高于S4组。
3.1.3. 淋巴结转移分层患者的基因表达
与对照组相比,我们发现NOTCH2在N0、N1和N2中显著下调。NOTCH3和HES1在N0、N1和N2中显著上调。NOTCH4、DLL1和DLL3在N0、N1、N2和N3范围内显著改变。此外,N1、N2和N3之间未发现显著差异,并且HEY1在亚组之间也未发生显著变化。NOTCH基因表达上调或下调与淋巴结转移状态无关。
3.1.4. 乳头状和非乳头状肿瘤的基因表达
与对照样品相比,乳头状肿瘤和非乳头状肿瘤中的NOTCH3、DLL3和HES1显著增加,而乳头状肿瘤和非乳头状肿瘤中的NOTCH1、NOTCH2、NOTCH4和DLL1显著减少。
对乳头状和非乳头状膀胱癌的分析显示,与非乳头状相比,乳头状中NOTCH2、JAG1、DLL1和DLL3的表达水平较低,而PT中NOTCH4、DLL4和HES1的表达水平上调。
3.1.5. 按种族和性别分层患者的基因表达
发现NOTCH2和DLL4在亚洲人(ASI,n=43)、白种人(CAU,n=323)和黑人或非洲裔美国人(AFA,n=23)之间的表达存在显著差异。与白种人相比,黑人或非洲裔美国人中NOTCH1、JAG1和JAG2显著上调,而与黑人或非洲裔美国人相比,亚洲人中NOTCH4显著上调。其中NOTCH3、DLL1、DLL3和HEY1的表达水平无显著差异。
队列包括299名男性和107名女性患者(性别比为3:1)。对照组中性别比为2:1(男性n=14,女性n=5)。只有JAG2和DLL3在女性患者中表现出性别特异性差异表达,并且表达水平较高。
3.1.6. 分子亚型的基因表达
我们研究了神经细胞(NET)、基底细胞(BT)、基底鳞状细胞(BST)、管腔(LT)、管腔浸润(LIT)和管腔乳头状细胞(LPT)的基因表达。与来自TCGA-BLCA数据集的非癌组织对照组(C-TCGA)相比,NOTCH1仅在LT中下调;NOTCH2在LT、LIT和LPT中下调;NOTCH4在BST中下调,而NOTCH3在LT、LIT、LPT和BST中上调。
3.1.7. 肿瘤抑制因子TP53突变分层患者的基因表达
根据TP53突变情况,将膀胱癌标本分为有突变(TP53M)和无突变(TP53WT)。与C-TCGA相比,TP53突变患者的NOTCH1、NOTCH2和NOTCH4表达下调,而NOTCH3表达上调。无突变的患者仅NOTCH2表达下调,NOTCH4表达上调。比较BCa组织中TP53的突变状态发现,TP53WT中NOTCH1和NOTCH4的表达较高,而NOTCH2的表达较低。
3.2. Notch相关基因的相关性和诊断价值,以及Notch通路、淋巴细胞亚型和免疫调节剂之间的相关性
3.2.1. 膀胱癌队列中Notch相关基因的相关性研究
相关分析显示NOTCH4与DLL4呈强正相关(r=0.81,p值<0.001),NOTCH1与JAG1呈中度正相关(r=0.59,p值<0.001),NOTCH3与JAG1呈中度正相关(r=0.43,p值<0.001),JAG2与DLL1呈中度正相关(图3)。
图 3
(A)膀胱癌靶基因间的相关性(n=406):直方图说明:(i)各分量的核密度估计和分布的直方图显示在对角线上;(ii)在对角线底部:显示带有拟合线的双变量散点图;(iii)在对角线的顶部:相关值加上星星的显著性水平;每个显著性水平与一个符号相关:p值0.001、0.01、0.05分别与符号、***、***、*相关;图表中的数字是皮尔逊相关系数(r),正标记为红色,负标记为绿色;(iv)图表两侧的数字表示表达式值的范围= Log2(read count value)。N1: NOTCH1, N2: NOTCH2, N3: NOTCH3, N4: NOTCH4, D1: DLL1, D3: DLL3, D4: DLL4, J1: JAG1, J2: JAG2, HS1: HES1, HY1: HEY1. (B)OPLS-DA结果。OPLS-DA-based分离膀胱癌和对照组。(B2)OPLS-DA各功能的可变投射重要性-VIP(variable importance in projection)。(C) 代表性ROC曲线显示膀胱癌检测在NOTCH1、NOTCH2、NOTCH3、NOTCH4、DLL1、DLL3、DLL4和HES1基础上的诊断准确率(AUC),C中标记的红十字是最佳阈值位置/值。
3.2.2. Notch相关基因的潜在诊断价值
如图3B1所示,大多数膀胱癌病例(n=406)可通过OPLS-DA评分图与对照组(n=40)进行区分。OPLS-DA中的可变投射重要性(variable importance in projection:VIP)确定了8个潜在的关键基因,按降序排列:DLL3、NOTCH4、NOTCH2、HES1、DLL1、NOTCH1、DLL4和NOTCH3(图3B2)。
3.2.3. Notch通路与淋巴细胞亚型及免疫调节基因的关系
对膀胱癌中Notch受体和配体与淋巴细胞浸润水平和相对丰度进行相关分析。对膀胱癌中Notch受体和配体与淋巴细胞浸润水平和相对丰度进行相关分析。NOTCH2与淋巴细胞的相关性最强,大多为阳性。相反,NOTCH3与大多数淋巴细胞呈负相关(图4A)。
图 4
免疫调节剂可分为免疫抑制剂和免疫刺激剂。NOTCH2似乎是Notch受体中最关键的成员,与免疫抑制剂呈正相关, 即,(i)转化生长因子β受体1(TGFBR1,ρ=0.435,p值<2.2×10)(图5C1),(ii)程序性细胞死亡1配体2(pCD1lg2;图5C2),(iii)巨噬细胞集落刺激因子I受体前体(CSF1R;图5C3)和(iv)NOTCH2具有程序性细胞死亡1配体1(CD274;图5C4)。相反,NOTCH3与大多数免疫抑制剂呈显著负相关,尽管相关系数相对较低(图5A)。此外,我们发现NOTCH4和DLL4与血管内皮生长因子受体2(KDR,ρ=0.762,p值<2.2×10)呈强正相关(图5C5;图5C6)。此外,我们还发现NOTCH2与免疫刺激因子之间存在中度相关性,其中与干扰素基因蛋白刺激因子(图5C7)和T淋巴细胞活化抗原CD86(图5C8)呈正相关。
图 5
3.3. 总生存率(OS)和无病生存率(DFS)分析
3.3.1. 总生存率(OS)对靶基因表达水平的依赖性
Kaplan-Meier估计表明,NOTCH3、JAG1、DLL4和HEY1高表达与OS降低显著相关。相反,HES1的高表达与延长生存期相关(图6)。
图 6
3.3.2. 无病生存率对靶基因表达水平的依赖性
Kaplan-Meier对DFS结果的估计显示,NOTCH3、JAG1、JAG2和HEY1高表达患者的DFS比低表达的患者短。相反,DLL4和HES1高表达与更好的DFS相关(图7)。
图 7
3.3.3. 独立因子的组合与OS和DFS相关,而与Notch因子的甲基化则不相关
Notch配体结合导致Notch受体的蛋白水解和不同靶程序激活,从而导致不同的细胞命运。因此,某些Notch受体和特定配体的结合可能是最相关的,因此,我们基于COX回归结果和线性拟合模型(风险评分=系数1*基因表达1+…+系数N*基因表达N)分析了Notch成员的几种组合与OS和DFS的相关性。我们发现显著延长的OS与四种组合的低值相关:(i)NOTCH3+JAG1(cut-off = 23.7, p-value = 0.047),(ii)NOTCH3+DLL4(cut-off = 15.7, p-value = 0.036),(iii)NOTCH3+JAG1+HES1(cut-off = 15.6, p-value = 0.024),(iv)NOTCH3+DLL4+HES1(cut-off = 4.1, p-value = 0.015)。
然而,我们没有发现目标基因的甲基化状态对OS或DFS有显著影响。
3.4. 基因网络与基因集富集分析(GSEA)
3.4.1. 基因网络分析
我们用GeneMANIA (http://genemania.org/,于2020年11月12日访问),以构建基因-基因相互作用网络。除了Notch因子外,该网络还包括另外20个可能频繁相互作用的基因,发现了435个链接(相互作用)(图8A)。这些联系包括基于基因邻域、基因共现、相似酶功能、相同途径和其他因素的共享蛋白质结构域(45.98%)、物理相互作用(25.26%)、途径相互作用(13.01%)、遗传相互作用(5.76%)和预测相互作用(4.95%)、共表达(4.81%)和共定位(0.23%)。
该网络的功能分析描述了基因在notch相关通路中的作用及其功能。在图8A中,我们将四个主要功能表示为彩色的圆形部分。总的来说,我们发现了23个与Notch信号通路直接相关的基因(蓝色):其中11个(NOTCH1-4、DLL1、DLL4、JAG1、JAG2、APH1A、APH1B、NCSTN)参与Notch受体加工(橙色),5个(DTX1、DLL3、DLL1、JAG1、JAG2)参与Notch结合(红色),4个(DTX1、LENG、NEURL1、HEY1)参与Notch信号通路调控(粉色)。功能部分重叠(图8A)。
此外,研究结果还揭示了与干细胞发育、细胞命运决定和免疫系统发育等其他功能的一些重要而有趣的相互作用。
3.4.2. 基因集富集分析(GSEA)
在GSEA中,典型路径分析是基于KEGG数据库。当通过NES对基因集进行排序时,我们发现“细胞周期”是最显著的术语(NES=2.04,p<0.001)(图8B)。根据NES的排序,基于Reactome pathway Knowledgebase[67]的经典路径分析显示与增殖、p53和DNA修复反应的基因显著富集,例如,“DNA损伤端粒应激诱导的衰老”(NES=2.22,p<0.0001)(图8C)。GSEA中基因本体论的生物过程本体论分析子集(GO分析的BP子集)也显示了参与增殖的基因集富集:“GO有丝分裂细胞周期检查点”(NES=2.21,p<0.0001)(图8D)。
此外,GSEA揭示了与树突状细胞(DC)、CD4 T细胞和CD8 T细胞相关的免疫特征基因集,例如“GSE20727 CTRL与ROS INH和DNFB过敏原治疗的DC DN的比较”(NES=2.26,p<0.0001;图8E)。
3.4.3. Notch通路与其他已知癌症相关通路的相互作用
利用GSEA,我们评估了靶基因与其他已知的癌症相关途径之间的关系。此外,我们还计算了Notch通路被Notch基因激活或抑制的膀胱癌病例的百分比。分析显示Notch通路在细胞周期和EMT中起着关键作用,NOTCH4、NOTCH2、NOTCH3、JAG1、DLL1和DLL4的高阳性(激活)或阴性(抑制)值表明了这一点(图8F)。
图 8
3.5. Notch相关基因和体图的肿瘤学分析
3.5.1. 膀胱癌中Notch因子的Meta分析
我们根据浸润性膀胱尿路上皮癌和非癌组织之间的表达水平进行了肿瘤胺meta分析(https://www.oncomine.org/)。meta分析显示,在以前的研究中,BCa中NOTCH3和HES1也显著上调(图9A,C),而DLL4的表达水平没有显著改变,在之前也没有得到广泛评估(图9B)。有趣的是,与本研究相反,在Dyrskjot的研究中,NOTCH1、NOTCH2和JAG1在膀胱癌中显著过表达,而其他被检测的基因没有显示出任何显著差异。
图 9
3.5.2. 正常和膀胱癌患者Notch因子体图的研究
为了观察正常人和膀胱癌患者中靶基因的分布和表达情况,我们从基因表达谱交互分析(GEPIA)数据库中构建了靶基因的表达体图谱((http://gepia.cancer-pku.cn)。图9描述了NOTCH3、DLL4和HES1作为Notch通路的代表基因。NOTCH3和HES基因的表达在BCa中分别上调2.47倍和1.48倍(图9A1、A2、C1、C2),而DLL4在膀胱癌中下调0.66倍(图9B1、B2)。
3.5.3. 正常膀胱组织和BCa组织中Notch相关蛋白的IHC研究
人类蛋白质图谱(HPA)的免疫组化(IHC)蛋白表达数据(https://www.proteinatlas.org/)证实了膀胱癌中NOTCH3(图9A3,A4)和DLL4蛋白(图9B3,B4)表达具有差异。
总结:
结果表明,NOTCH2、NOTCH3和DLL4是膀胱癌中Notch信号的潜在驱动因素,通过调节细胞周期和干细胞,以及与已知的肿瘤相关途径如p53、TSC/mTOR、RAS/MAPK和PI3K/AKT直接或间接相互作用,在膀胱癌进展和发展中起着最关键的作用。