通过癌症转录组的非组织特异性核心特征准确地重新定位药物
Accurate Drug Repositioning through Non-tissue-Specific Core Signatures from Cancer Transcriptomes
Brief
作者使用TCGA数据库中癌症转录组数据,得到了核心转录组特征,其代表了8476个人类基因的单基因突变,并开发了一种药物重新定位方法,用于预测1938种药物的高特异性候选靶基因。 应用于靶向衰老通路,发现了7种延长寿命的药物,并在功能上得到了验证。
Highlights
非组织特异核心特征(CSs)是从8476个人类基因中生成。
csD2G通过药物基因CS模块和特异匹配重新定位药物
预测靶向AKT和AMPK的钙阻滞剂,并由医疗记录验证
重新定位七种药物以选择性地靶向AKT和AMPK并延长寿命
Abstract
在体外环境下在对药物重定位的实验性大规模筛选的限制以及对真实人类条件适用性的缺乏。本文中,作者开发了一个从TCGA中得到的8476个基因的单组织突变非组织特异核心转录组特征(CSs)的人类体内环境下的筛选。我们开发了核心特征药物-基因(csD2G)软件,以扫描3546个药物治疗谱。 csD2G在覆盖率和特异性方面明显优于传统的基于细胞系的基因扰动特征和现有的药物重新定位方法。本文强调了3点应用:(1)重新定位的精神药物类别,以抑制TGF-β途径; (2)抗高血压钙通道阻滞剂预测可激活AMPK并抑制AKT通路,并经临床电子病历验证; (3)预测和验证7种药物,以选择性地靶向AKT-FOXO和AMPK途径,从而调控蠕虫的寿命。
Introduction
生物制药行业面临三大挑战:(1)研发阶段巨额支出与新药产量不成比例之间的生产率差距。 (2)复杂疾病和人口老龄化需要更有效的药物。(3)基于体外细胞试验或小鼠模型开发的药物通常不能转化为人类治疗,大多数未通过临床试验显示无效或不良作用。通过药物基因组学数据的综合分析进行的计算重新定位预测取得了重大进展,因为它们成本低,克服了实验性高通量药物库筛选的许多实际限制。本文中,为了消除原始组织背景的影响,并在人类环境中重新定位药物,我们从癌症基因组图谱(TCGA)转录组中构建了非组织特异性核心特征(CS)。CS用于识别模拟单基因突变扰动特征的药物。使用3546种药物治疗谱,本文还开发了药物特异性评分系统,以预先准确预测具有高靶向特异性的83745个DGI(药物-基因互作)。本文还预测抗高血压钙通道阻滞剂抑制AKT通路并激活AMPK通路,这些通过电子病历支持,显示降血脂作用 - 预期AKT抑制和AMPK活化的结果。准确的计算机重定位DGI为进一步探索提供了丰富的资源。
Result
结果1 从癌症转录组中产生信基因的核心转录组特征
细胞信号通路响应细胞外刺激以调节基因表达,细胞代谢和发育,已被公认为疾病治疗的基本药物靶点。在不同的组织或细胞类型中,核心途径及其直接下游靶基因通常共享效应子,但这些通路的最终输出可能非常不同。为了关注和验证通路的核心作用,我们策划了4895个编码受体,酶,离子通道,TF和8种主要信号通路组分的信号基因。如下图所示:
TCGA提供数千种来自人类癌症患者的高质量转录组,以及> 20种癌症类型的组织匹配的正常对照。基因中的体细胞突变的癌症样本可用于识别其转录组扰动特征。此外,癌症的丰富多样的组织来源提供了寻找多个组织共有的常见差异表达基因(DEG或特征基因)的机会,以代表基因突变的核心效应,而无需组织原因背景。
本文构建了一个流程,输入4895个信号基因,使用TCGA突变和转录组数据生成CS,如下图所示:
对于每种癌症类型,将基因中携带每种类型突变(例如,错义突变,无义突变,移码缺失,移码插入)的患者样品定义为遗传扰动组,并与正常对照进行比较以检测每种癌症类型中的突变类型特征,见上图中step1和step2。不同的突变类型被分别分析,因为我们观察到它们经常导致同一基因的不同表达变化。这表明可以探测同一基因的各种扰动型效应。本文将相同组织的癌症视为具有相同的起源组织,然后通过强制跨多个组织的重叠来产生CS,见上图中的step3和step4。接下来是CS修剪步骤,去除> 50%癌症类型共有的87个DEG作为常见的肿瘤背景。为了降低数据复杂性并排除未确定或替代解释,我们在研究中仅使用单基因突变CS进行分析,丢弃源自多个基因通常发生突变的样本的CS。
使用这个流程,本文获得了4895个信号基因中的2052个CS。 超过98%是错义突变。主要发生在蛋白质编码区,包括功能域,可能导致功能丧失。
通过自动优化贝叶斯信息准则(BIC)-SKmeans算法对2052个信号基因的CS进行聚类分析,显示9/13基因簇显著富集在Notch,Wnt,TGF-b途径,G蛋白偶联受体,催化受体,TF和电压门控离子通路中。相同通路或具有相同功能类型的基因自动组合在一起,这表明CS可以识别和代表受人类遗传扰动影响的不同信号通路并将它们彼此分开。
为了评估CS的有效性,作者将它们与由单基因RNAi,遗传突变和从GEO收集的相同基因的过表达(OE)产生的196个常规特征进行了比较。通过基因集富集分析(GSEA)确定,总共78/114(68%)的CS与至少一个相应的常规特征显示出显著重叠。对于所有匹配的CS对和常规特征,与随机背景相比,CS在相同基因的不同扰动下捕获一致表达改变方向时始终表现出更高的精确度和灵敏度。如下图所示:
同样,CS对于实现药物重定位的高准确性也是必不可少的。这些证明了CS可以在不同的实验方法中一致地表现出基因的转录组扰动。
结果2 通过CSs扫描药理转录组以重新定位药物
为了使用CS进行药物重新定位,我们首先基于CMap生成了3546种药物治疗特征(DTS),其中包含1309种药物处理的3种人癌细胞系的微阵列数据。
为了评估药物对基因组的特征重叠程度和潜在作用模式,我们定义了由GSEA确定的带有加号或减号的药物对基因标准化富集评分(d2gNES)来测试CSs 针对DTS基因表达改变的排序列表。如下图所示:
d2gNES阳性评分表明药物与基因突变具有相同的模式。因为大多数产生CS的基因突变可能是功能丧失突变,所以d2gNES阳性评分暗示该药物抑制该基因的活性。相反,阴性d2gNES意味着药物激活基因的活性。作为背景对照,我们为每个信号基因生成随机CS基因集,并为每个DTS重复分析1000次,从而识别了924357个显著相互作用。
通过BIC-SKmeans算法对d2gNES进行聚类表明,尽管分析了数千种药物和基因,但药物和基因都被自动聚类成相对较少且有限数量的基因和药物类别,如下图所示:
2452种药物聚集成13种DC,并且相应的DC对GC具有激活或抑制。例如,我们发现13种精神药物(DC-3和-4)可能抑制TGF-β通路基因(GC-2)。其中两种是溴隐亭和三氟拉嗪,已经被报道抑制TGF-β。其余7种吩噻嗪类药物与三氟拉嗪的化学结构相似性较高,包括三氟拉嗪在内,6/8的吩噻嗪DTSs具有与Bmpr1a敲除小鼠胚胎干细胞相似的DEG特征,与Tgfbr2敲除小鼠腭组织的特征相似7/8。如下图所示:
上述结果表明了吩噻嗪类药物的信号传导途径靶标和它们抗精神病作用的潜在分子机制。
DC 6含有许多钙通道阻滞剂(CCB),显示AMPK活化(在GC 1中)和AKT抑制(GC 6)特征。在CMap的15个CCB中,预测9个(60%)激活AMPK通路,根据2个通路的代表性基因PRKAA2和AKT2的d2gNES预测6个(40%)抑制AKT通路。如下图所示:
其中女性CCB治疗组与服用其他抗高血压药物的组相比,显示出更低的总胆红素水平(TBILs)和较高碱性磷酸酶(ALP)活性(t检验p = 0.0386),这是激活AMPK和抑制AKT的预期效果。除ApoA-I和TBIL外,其他指标在男性中没有显示相同的模式,表明女性中CCB的性别特异性抗血脂作用。
结果3 高特异性的药物重定位
因为药物对特定通路或基因的特异性是一个好的药品的理想或必要特征,我们基于连接特异性指数(CSI)测试了3个评分来评估药物的基因水平的特异性和选定的药物-基因CSI,可以更好的区分金标准-阳性的DGIs和非金标准-阳性的DGIs来评估药物-靶标的特异性。如下图所示:
药物重定位是为了发现已存在药物的可替代靶标,根据定义,不一定特定于单个靶基因,也可能是基因模块(通路水平)特异性的。因此,使用d2gCSI,我们只保留对不同DC具有高于平均特异性的GC(代表无偏自组装通路),然后进一步要求在剩余2052个信号基因中DGI的基因水平特异性d2gCSI≥0.8,最佳的富集了GSPs。1888种药物和1275个信号基因的83745个DGIs(所有可能的DGIs中的1.2%)作为特异的DGIs。例如,吩噻嗪对TGF-β的预测抑制被确定为特异性的,而对AKT的抑制和对CCB的AMPK的活化被确定为非特异性的。将我们的方法(包括上述d2gNES和d2gCSI步骤)称为核心特征药物-基因(csD2G)预测,并使用衍生的83745个csD2G DGI进行后续的分析和性能评估。
结果4 现有药物重新定位方法的性能比较
目前,乒乓算法(PPA)和多变量方差分析(MANOVA)是药物重新定位的2种最佳方法。它们将药物反应与基因表达或不同细胞系中的突变相关联以推断靶标。由于这些先前方法中使用的数据类型与csD2G使用的CMap和CS不同,我们将数据和相应方法的组合视为整体策略进行比较。策略之间共享的药物和基因集用于性能比较。ROC曲线显示csD2G在药物 - 靶标预测中显著优于PPA和MANOVA(曲线下面积[AUC]:csD2G为0.743,PPA为0.676和0.659; csD2G为0.685, MANOVA为0.486; DeLong测试p = 0.0367)。如下图所示:
研究发现,csD2G优于DeMAND(Woo等,2015),并且也超越了最近发表的L1000基因实验药物扰动结果。基于DeMAND,L1000和本文的分析之间共享药物的覆盖率和准确度如下图所示:
结果5重新定位药物的功能验证
AMPK和AKT-FOXO通路在癌症、年龄和代谢类疾病中有着重要作用。但是没有发现小分子特异的抑制IGF1通路或特异的增强AMPK通路的活性。因此探究csD2G结果中2个通路的29个基因(下图A)。在通路中所有的27个基因中,聚类发现DC-24和DC-32分别对2个AMPK基因(AMPK催化亚基基因PRKAA2和非催化亚基基因PRKAG3)和FOXO4基因(对AKT2有微弱抑制)有强和特异的活性特征(下图C、D)。
在12种预测的AMPK激活剂中,3种(25%)是已知的能激活AMPK,1种(8%)能延长寿命(下图C、D)。7种(56%)显示与已知的AMPK活化剂5-aminoimidazole-4-carboxamide 1-β-d-ribofuranoside (AICAR)和sorafenib相同的模式。对于22种预测的AKT-FOXO靶向药物,已知41%影响该通路,27%延长寿命,69%显示与已知AKT抑制剂perifosine有相同的模式。由于AMPK和AKT参与了许多癌症,我们进一步测试了这些药物的潜在抗癌作用,发现预测的AMPK激活剂和AKT抑制剂中的8/12(67%)和20/22(91%)具有显着的重叠特征,并在21个TCGA癌症特征中的至少有一个。其中,7/8(88%)的AMPK药物显示在至少1种癌症有相反表达模式,14/20(70%)的AKT药物显示相同的模式,表明这两类预测药物可能具有抗癌潜力。
抑制AKT或激活FOXO和AMPK可延长秀丽隐杆线虫的寿命。我们推断,由于不能推断寿命延长是由随机非特异性效应引起的,因此寿命测定对重新定位的AKT-FOXO或AMPK调节剂是一个很好的评估。因此,作为我们预测的12种特异性AMPK激活剂和24种AKT抑制剂的功能验证,我们从这些预测中随机选择了7种药物并测试了它们在秀丽隐杆线虫中的寿命效应。六种药物(85.8%)显著延长了寿命。药物治疗3天后,蠕虫咽部抽吸率没有变化,不包括食物摄入量减少导致寿命延长的可能性。我们还测试了2种未预测出与寿命有关的药物作为阴性对照,并且两者均显示在秀丽隐杆线虫寿命测定中没有寿命的延长。与随机选择的通路或其他的寿命调节的通路相比,他们预测的高特异性通路与这些重新定位药物的高特异性一致,这些DC有更多的文献共同引用。与平均预期相比,它们还具有相对较少的非靶向途径。
为了进一步测试重定位药物的特异性,我们测试了他们预测的靶基因或通路的异位显性,测试了AKT-FOXO-axis (daf-16)和AMPK(aak-2)突变是否消除了寿命延长效应。正如预期那样,6中寿命延长的药物在daf-16或aak-2上是异位显性的(下图A和B)。我们还证实了所有6种直接调控的AKT和AMPK磷酸化的药物(图C和D)。相比之下,在去除6种寿命延长药物这个背景前,我们不能准确预测他们的MoA,有些甚至显示相反的结果。显示了去除可靠药物反应的原始组织特征的重要性。
为了进一步实验测试药物特异性,本文测试了预测的AMPK激活剂和AKT抑制剂对aak-2和daf-16突变体以及sir-2.1突变体(代表了不相关的寿命调节通路)寿命的影响。可能由于AKT和AMPK通路之间的大量交叉,daf-16和aak-2突变体都可以阻断5种AKT或AMPK药物的寿命延长(下图所示),而5种测试药物中有4种显示出来和sir-2.1突变体中相似的寿命延长,表明了它们的去乙酰化酶通路的整体独立性。
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史