大家好,今天给大家分享的文献是2022年4月份发表在Cell Genomics上的文章。识别由疾病相关变异引起的细胞功能失调,可能意味着在细胞治疗中发现药物靶标或调节新途径。本研究是第一次深入研究免疫疾病变异对Treg细胞基因表达调节和功能失调的影响。
Immune disease variants modulate gene expression in regulatory CD4+ T cells
在调节性CD4+ T细胞中免疫疾病变异调节基因表达
背景:通过全基因组关联研究(genome-wide association studies,GWASs)绘制的数千种疾病变异为疾病生物学提供了遗传锚,但对GWAS信号的功能解释一直具有挑战性,因为绝大多数变异是非编码的。一种将遗传变异与下游效应联系起来的方法包括表达数量性状位点(expression quantitative trait locus,eQTL)作图,其转录水平与遗传多态性相关。然而,由于遗传变异之间的连锁不平衡(linkage disequilibrium,LD),已鉴定的eQTL通常导致数十到数百个相关变异与基因表达水平相关联,因此无法确定致病调节变异。
通过使用染色质可及性或组蛋白修饰(chromatin QTLs,chromQTLs)对染色质活性进行QTL作图,可以进一步推断出基因表达变化背后确切调控变异的优先级。在这种方法中,调节染色质标记活性的变异与chromQTL物理重叠。eQTLs和chromQTLs的组合提供了一个强大工具包,用于将非编码变异与表达基因联系起来,用于确定功能变异的优先级,并用于确定调节基因表达的机制。最后,疾病GWAS信号与eQTLs的共定位可以指向疾病关联的致病基因和机制,因此可将疾病相关变异与失调途径和新药物靶点联系起来。
与常见免疫介导疾病相关的GWAS变异,如炎症性肠病(inflammatory bowel disease,IBD)、1型糖尿病(type 1 diabetes,T1D)和类风湿性关节炎(rheumatoid arthritis,RA),均富含活性染色质标记,这些可以标记CD4+ T(尤其是调节性T细胞(regulatory T cells,Treg细胞))中的增强子和启动子。免疫表型研究表明,循环Treg细胞数量异常和Treg细胞抑制功能缺陷均导致免疫疾病患者以及器官和造血干细胞移植受者的免疫反应。总之,Treg细胞中基因表达失调的遗传锚和指向这种细胞类型功能受损的免疫表型研究表明,确定遗传变异调节Treg细胞功能的机制可能具有重要的临床意义。尽管Treg细胞在维持免疫反应中发挥着关键作用,但它们在循环血液中的低频率导致可用基因组资源数量有限。因此,免疫疾病变异通常根据来自外周血单个核细胞(peripheral blood mononuclear cells,PBMCs)、免疫细胞或分离出的主要免疫细胞群数据来解释基因表达。但这些数据集可以稀释或忽略仅存在于稀有细胞类型中的基因调控作用,因此可能会错过对疾病有意义的生物效应。
在这里,为了能在与疾病生物学密切相关的细胞类型背景下解释免疫疾病变异,作者生成了第一张从124名健康个体中分离出的Treg细胞基因表达调控图谱。作者确定了10880个QTLs效应(3685个eQTLs和7195个chromQTLs)。与初始CD4 T细胞和单核细胞相比,作者在Treg细胞中检测到21%的eQTLs和29%的活性增强子和启动子QTLs。通过将Treg QTLs与14种不同免疫疾病相关变异共定位,作者在Treg细胞中鉴定了133个功能相关的GWAS基因座。免疫疾病GWAS信号与chromQTLs的重叠改善了68个免疫疾病位点上的相关变异。作者将Treg细胞eQTLs基因分配到81个免疫疾病位点。在52个位点中检测到无法与下游基因靶点关联的chromQTLs共定位,表明基因调控效应可以在特定细胞状态下表现出来。最后,作者使用优先级基因确定用于重新使用的药物并定义验证的新靶标。作者的研究提供了从免疫疾病相关变异,通过基因表达调控Treg细胞,到新的治疗方案的转化途径。
方法:
RNA-seq、转座酶可接近性染色质测序(assay for transposase-accessible chromatin using
Sequencing,ATAC-seq)、H3K4me3和H3K27ac ChM-seq(ChIPmentation-seq)、
结果:
1.Treg细胞中基因表达调控的全面目录
为了鉴定健康人分离的Treg细胞中基因表达调控的遗传变异,作者使用RNA-seq分析了转录组(124人)、ATAC-seq分析了染色质可及性(73人)、用H3K4me3分析启动子(88人)和用H3K27ac分析活性增强子和启动子区域(91人)(图1A)。作者检测到12517个基因表达,而染色质分析显示39134个可及性区域、39409个H3K4me3标记的启动子区域和33910个H3K27ac标记的活性染色质区域(图1B)。用62个样本,作者估计了由遗传成分和染色质调控特征解释的基因表达变异百分比。作者观察到驱动转录变异的主要成分是普通的遗传变异。对于75%的eQTL基因,作者能解释5%或更多的表达变异(图1C)。接下来作者进行了QTL作图以定义Treg细胞中受遗传控制的基因和染色质特征。作者检测到3685个基因(29%)和125650个eQTL变异至少有一个独立关联(图1B-1D)。作者使用染色质可及性(caQTL,1450;4%)、H3K4me3(promQTL,1455;4%)和H3K27ac(actQTL,4290;13%)组蛋白标记,共绘制了7195个chromQTLs,对应于9292个非重叠峰值区,与152648个chromQTL变异相关。在H3K27ac特征中检测到大多数chromQTLs(4290个actQTL;图1B)。在所有分析中,基因变异(5761739)、439582(7%)处于峰值内;然而,只有一小部分映射到染色质特征中,并且还与chromQTLs(38507个SNPs;0.7%)、eQTLs(22217个SNPs;0.4%)或两者(17815个SNPs;0.3%)相关联(图1D)。对于28%(1035)的所有eQTLs基因,作者观察到至少一个eQTL变异是chromQTL,并且也位于染色质峰中(图1E),对于另外2020个eQTLs基因,作者能够将一个eQTL变异与染色质峰联系起来,虽没有检测到染色质特征上的QTL效应。这种重叠的一部分可能没有功能,因为染色质调控特征在整个基因组中都很丰富,因此偶然可能会重叠常见的遗传变异。有趣的是,作者无法将大多数actQTL变异与eQTL联系起来(图1E),这意味着这些调控区域可能在特定的细胞环境下或通过多个调控元件的相互作用调节基因表达。
图1 Treg细胞QTLs定位概述。(A)研究设计示意图。(B)每个方法中每次基因组试验定义的特征数和显著QTLs数。(C)由遗传变异和染色质标记解释的eQTL基因表达变异比例。(D)基因变异的功能分类。(E)eQTL基因分类(上)和actQTL峰分类(下)。
2.定义Treg细胞的基因表达调控
在确认了数据集捕获了与Treg细胞生物学相关的效应后,作者接下来使用了BLUEPRINT项目中的CD4初始T细胞,因为它也分析了转录组和H3K27ac且研究对象类似。作者观察到69%的eQTLs与初始CD4 T细胞共用(图2A),且具有相似的效应大小和相同效应方向。在Treg细胞和初始T细胞之间观察到eQTL效应的相关性高于Treg细胞和单核细胞之间的相关性,这也由pi1估计值证实(图2B和2C)。尽管Treg细胞和其他两个细胞类型之间的有大量eQTL共享,作者将775个基因分类为Treg细胞数据集特有的,其中包括92个在Treg细胞中表达的基因。在Treg细胞特异性eQTL中,有许多对免疫功能调节至关重要的基因,包括TNFRSF14,一种将淋巴细胞吸引到上皮细胞的趋化因子(图2D)。作者比较Treg、初始T细胞和单核细胞中相同峰值区域的遗传效应,观察到1307个(29%)actQTLs是Treg细胞特异性的(图2A)。尽管所有峰效应大小的一致性很小,但具有共享QTLs的峰表达了相似效应大小(图2B)。pi1分析的结果也反映了作者从RNA中观察到的Treg细胞QTLs在原始数据集中的复制率高于单核细胞(图2C)。在Treg细胞特异性actQTL效应中,作者观察到FCRL3基因启动子的一个峰值是Treg细胞抑制功能的潜在负调节因子(图2E)。
图2 在调节性T细胞、CD4+初始细胞和单核细胞中鉴定的eQTLs和actQTLs比较。(A)Treg细胞的eQTLs和actQTLs与初始T细胞和单核细胞的比例比较。(B)三种细胞类型之间eQTLs和actQTLs的成对pi1得分。(C)所有eQTLs和actQTLs的相同基因或峰的回归斜率和变异对之间的Spearman相关性(彩色),以及和共享对之间的Spearman相关性(灰色)。(D和E)Treg细胞特异性(D)eQTL和(E)actQTL的例子。
3.Treg细胞QTLs与免疫疾病位点共定位
为了将疾病相关位点精细定位到致病基因和变异中,作者接下来将Treg细胞QTL结果与来自常见免疫疾病的GWAS信号相结合,应用贝叶斯框架来测试疾病相关变异和Treg细胞QTL信号共定位。作者测试了14种免疫疾病相关的1290个独特的GWAS基因座:过敏性疾病(allergic diseases,ALL)、强直性脊柱炎(ankylosing spondylitis,AS)、哮喘(asthma,AST)、乳糜泻(celiac disease,CEL)、克罗恩病(Crohn’s disease,CD)、炎症性肠病(inflammatory bowel disease,IBD)、多发性硬化症(multiple sclerosis,MS)、原发性胆汁性肝硬化(primary biliary cirrhosis,PBC)、银屑病(psoriasis,PS)、类风湿性关节炎(psoriasis,RA)、系统性红斑狼疮(systemic lupus erythematosus,SLE)、1型糖尿病(type 1 diabetes,T1D)、溃疡性结肠炎(ulcerative colitis,UC)和白癜风(vitiligo,VIT)。共定位数量最多的疾病(超过20个共定位信号)包括IBD、UC、CD、ALL、T1D、VIT和PBC(图3A)。作者观察到疾病基因座和至少一个Treg细胞QTL之间有360个明显共定位,对应133个独特GWAS基因座(图3B)。将共定位基因座分为三类:第1层基因座包含GWAS关联与eQTL和染色质QTL共定位的31个信号。第2层基因座包含50个信号,只观察到eQTL共定位。第3层中52个位点包括与染色质QTL共定位的GWAS信号,但不包括eQTL,第3层位点代表了大多数共定位。接下来,作者评估了那些已识别的eQTL与特异性调控Treg细胞基因表达的免疫疾病变异体共定位,,而不是初始T细胞或单核细胞。在81个与Treg细胞eQTL共定位的GWAS位点中,31个为Treg细胞特异性位点,且它们不存在于初始T细胞或单核细胞中(图3C)。
图3 免疫疾病GWAS位点与Treg细胞QTLs的共定位。(A)Treg细胞eQTLs和染色质QTLs与不同免疫疾病GWAS位点共定位的分布。(B)GWAS位点与不同类型Treg细胞QTLs共定位的分布。(C)与单核细胞、初始T细胞、Treg细胞eQTLs和actQTLs共定位的免疫GWAS位点数量。
4.共定位Treg细胞QTLs优先考虑免疫疾病的致病变异和基因
使用与染色质QTL峰重叠的第1层和第3层基因座,作者将68个GWAS基因座的信号从中位数48个相关变异细化为每个位点6个功能变异基因座(图4A)。在68个基因座中,BACH2、CD28、CENPW、HERC2、JAZF1、MAP3K8、PIM3、RERE、STAT5A和THBS3基因座与eQTLs共定位并被精炼为单一功能变异(图4B)。Treg细胞专有共定位以及Treg细胞actQTL特异性共定位表明Treg细胞生物学特征的通路调控。因此,作者更详细地研究了带IBD GWAS信号的Treg细胞专有共定位,由chr10:30,401,447(rs10826797)变异标记,该变异与actQTL共定位,在MAP3K8的TSS处调节一个6 kb大的H3K27ac峰和一个MAP3K8基因的eQTL(图4C)。此外,作者观察到与过敏相关的基因座与STAT5A eQTL以及80 kb actQTL共定位。该峰与STAT5A TSS重叠。近一半过敏变异LD与受调控的actQTL峰重叠,其中一个变异chr17:42,266,938(rs34129849)也映射到STAT5B基因内含子处629-bp开放染色质区(chr17: 42,266,595– 42,267,224)(图4D)。
图4 与Treg细胞QTLs共定位的免疫疾病关联功能细化。(A)在x轴上LD中的SNPs数量,映射到y轴的chromQTL的SNPs数量达到峰值。(B)在LD中映射到chromQTL内部的SNPs数量在x轴上达到峰值,同时映射到y轴的chromQTL和ATAC的SNP数量也达到峰值。(C和D)从上到下显示基因注释轨迹;ATAC-seq、H3K27ac和H3K4me3 ChM-seq的染色质景观;疾病区域关联图;eQTL和actQTL关联p值,主要集中在被纯合子基因型分层的H3K27ac图谱中;被eQTL和actQTL分层的基因型小提琴图。(C)显示了与MAP3K8 eQTL和由chr10:30,401,447(rs10826797)标记的IBD共定位基因座。(D)显示了由chr17:42,262,844(rs7207591)标记的与STAT5A eQTL和chr17:42,219,755 42,299,818 actQTL共定位的过敏相关的基因座。
5.Treg细胞QTLs阐明了CD28共刺激、肿瘤坏死因子和IL-10信号通路的药物靶向作用
尽管GWAS在绘制疾病风险变异方面取得了成功,但将这些发现转化为药物靶点一直具有挑战性。因此,作者使用Open Targets Platform系统地评估与免疫疾病信号共定位的eQTLs是否能够识别已知和潜在的新药靶点。在与免疫疾病共定位并在Open Targets Platform测试的91个eQTL基因中,发现了9个(第1层:BLK、CD28、PIM3、PTGIR和TNFRSF9,第2层:ERAP2、NDUFS1、TNFRSF1A和TYK2;图5A)已成为已知药物的靶标并用于临床或正在进行临床试验。其中7个eQTL基因可以考虑用于药物再利用:ERAP2、NDUFS1、PIM3、PTGIR、TNFRSF1A、TNFRSF9和TYK2,其中三个是Treg细胞特异性eQTLs。作者还观察到63个基因尚不属于临床治疗的一部分,但具有药物治疗的证据,其中47个被归为高成药性(其中8个是Treg细胞特异性的;图5A)。作者使用Open Target定义成药性,它基于蛋白质中可用于小分子结合位点的可用性,抗体治疗中可接近的抗原表位的存在,或一种化合物在临床试验中具有不同于小分子或抗体形态的报告。作者观察到具有易处理特点的基因分为三个途径:CD28家族共刺激、肿瘤坏死因子(tumor necrosis factor,TNF)信号传导和IL-10信号传导(图5B)。这些途径在Treg细胞活化、增殖和存活以及抑制效应T细胞中起重要作用。
图5 免疫疾病与Treg细胞QTLs的共定位决定药物靶点。(A)1层和2层位点与免疫疾病具有药物易处理性的GWAS变异共定位。(B)在CD28共刺激、TNF和抗炎IL-10通路中,具有易处理潜力的1层和2层基因。
结论:
1.文章构建了来自124人的CD4+ Treg细胞中基因表达和染色质活性的数据集。
2.构建了3685个基因和7195个染色质区数量性状位点QTL图谱。
3.Treg细胞QTLs和免疫疾病GWAS变异的共定位可以发现药物靶点。
参考文献:Bossini-Castillo L, Glinos D A, Kunowska N, et al. Immune disease variants modulate gene expression in regulatory CD4+ T cells[J]. Cell Genomics. 2022,2(4):100117.