今天跟大家分享的是十一月份发表在Aging (Albany NY)杂志上的一篇文章,这是一篇关于软组织肉瘤免疫与ceRNA的文章。
The construction and analysis of tumor-infiltrating immune cell and ceRNA networks in recurrent soft tissue sarcoma
复发软组织肉瘤的肿瘤浸润免疫细胞和ceRNA网络的构建与分析
软组织肉瘤(STS)是医学肿瘤学家最具挑战性的肿瘤之一,初次切除后复发率很高。本工作利用TCGA的259个原发和3个复发肉瘤数据构建了复发性肉瘤的竞争性内源RNA(competing endogenous RNA, ceRNA)网络,发现7个复发和生存相关基因(LPP-AS2,MUC1,GAB2,hsa-let-7i-5p,hsa-let-7f -5p,hsa-miR-101-3p和hsa-miR-1226-3p)。应用CIBERSORT算法来估计肉瘤中免疫细胞的比例,发现5种与复发相关的免疫细胞,并构建了一个复发性肉瘤特异性免疫细胞网络。基于基因和免疫细胞的两个诺莫图均具有良好的预测性能(5年生存AUC分别为0.724和0.773。进一步进行共表达分析,以鉴定复发性肉瘤特异性免疫细胞和ceRNA之间的潜在调控网络。hsa-miR-1226-3p和MUC1显着相关,而树突状细胞静止与hsa-miR-1226-3p相关。此外,还通过免疫组织化学分析和多个数据库验证了MUC1和树突状细胞标志物CD11c的表达。总之,这项研究阐释了hsa-miR-1226-3p调节MUC1的潜在机制,且树突状细胞的静止可能在STS复发中起重要作用。
图1.分析流程
一. 结果
1. 差异表达基因的识别
首先从TCGA获取了259个原发和3个局部转移的肉瘤样本(两类样本数目不平衡),具体分析流程如图1所示。在TCGA数据库中包含14447个lncRNA,2588个miRNA和19660个mRNA。利用edgeR进行差异表达分析,筛选|logFC| > 1和FDR < 0.5的基因认为是在原发和复发的肉瘤中是差异表达的。对差异基因利用heatmap进行展示(图2)。并对基因的差异情况绘制火山图,图2 B, C, D分别表示差异基因178个,差异蛋白编码基因148个,差异lncRNA 21个,可以发现大部分的基因是显著下调的。
图2.差异表达基因热图和火山图
2. ceRNA网络的构建和生存分析
11个lncRNA-miRNA关系和12个miRNA-mRNA关系构成了包含23个基因的ceRNA网络(图3 A,表1)。并进一步利用cox回归以及绘制KM曲线评估生物标志物和生存之间的关联,发现均与生存时间显著相关(图3B-G)
图3. A) ceRNA网络; B-F)生存因子KM曲线。
表1. ceRNA网络的超几何检验和相关性分析
七个潜在的复发和生存相关的生物标志物整合到一个新的多变量模型中(表2,在这里注意word的自动纠错把hsa错误的纠正成has)。利用lasso回归发现七个变量都与复发模型相关。此外,ROC曲线的3年生存的AUC值为0.731, 5年生存的AUC值为0.724,并进一步绘制诺莫图(图4)。
表2. ceRNA网络中关键基因的Cox比例风险回归模型的显著性
图4. 七个关键的ceRNA的多变量cox回归和诺莫图以及预测模型ROC曲线
3. 肉瘤免疫细胞的组成
利用CIBERSORT算法评估bulk测序中的免疫细胞组成(图5A),自然杀伤细胞激活(NK cell activated)的比例在复发的组织中比原发的相对较低,而树突细胞静息(dendritic cells resting)和肥大细胞静息(mast cells resting)比例在复发的肉瘤中相对较高,并利用wilcoxon秩和检验去评估比例的差异性(dendritic cells resting, P = 0.036; NK cells activated, P = 0.036),图5C。
图5. A)肉瘤病人的不同免疫细胞的比例以及 ;B)热图;C)原发和复发肉瘤的差异
4. 整合分析免疫细胞、基因和预后
将所有免疫细胞比例整合到cox回归模型中,利用lasso回归,发现NK细胞激活(P = 0.029),树突状细胞静止(P = 0.013),肥大细胞静止( P < 0.001),肥大细胞激活(P = 0.030)和巨噬细胞M1(P = 0.024)是和cox模型是显著相关的(表3)。且lasso回归的结果表明没有出现过拟合(图6 A, B)。ROC曲线同样也表现出有着好的预测性能(图6 C, F),并用多变量分析的结果构建了诺莫图(图6 E)。进一步计算免疫细胞的比例和ceRNA网络中的关键分子之间的相关性,结果显示hsa-miR-1226-3p与树突细胞静止显著相关(图7)
图6. 免疫细胞比例的多变量cox回归和诺莫图以及预测模型ROC曲线(注意:图6D,X坐标单位有错)
表3. 关键免疫细胞比例的Cox比例风险模型结果
图7. A, B)免疫细胞比例的相关性和ceRNA网络中的关键基因的相关性. C- D) hsa-let-7i-5p,hsa-miR-1226-3p与树突细胞静息比例之间的相关性
5. MUC1和CD11c与肉瘤复发相关
在原发和转移的样本中检测了MUC1和CD11c的表达(表4),发现在复发的肉瘤(平滑肌肉瘤, LMS;脂肪肉瘤, LPS)中显著上调,且通过免疫组化同样也可以看到在复发肉瘤中显著高表达(图8)。
图8. MUC1和CD11c在原发和复发肉瘤中的表达
表4. 原发和复发的肉瘤MUC1和CD11c的差异表达
6. 多维数据验证
在多个数据集中验证了MUC1和CD11c的表达,我们同样可以发现在癌症中MUC1显著上调(但是这里并没有提到复发和原发之间的差异)。
表5. MUC1和CD11c的多维数据验证
结论
该工作基于肿瘤浸润的免疫细胞和ceRNA网络构建了两个诺莫图来预测肉瘤患者的生存和复发,证实预测模型具有较高的AUC。此外,推测hsa-miR-1226-3p调节MUC1和树突状细胞静止可能在肉瘤的复发中起重要作用。
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史