背外侧前额叶皮层中条件eQTL的图谱与精神分裂症GWAS的共定位
摘要:
本文利用467例人脑样本的基因型和基因表达水平进行了全面分析,展示了特定细胞或时间背景下提高GWAS关联映射的条件eQTL信号。条件eQTL普遍存在,63%具有主要eQTL的基因也具有条件eQTL,与条件eQTL相关的基因组特征与基因表达的背景特异(例如组织,细胞类型或发育特定的时间点)调节一致。整合精神分裂症GWAS和eQTL数据显示40个基因座有力证明具有共定位,包括具有条件eQTL共定位的6个基因座。共定位分析支持验证以前研究的基因,也可以识别与精神分裂症(SCZ)风险相关的新基因。
介绍:
全基因组关联研究(GWAS)位点内的致病基因和突变可以通过整合GWAS统计数据和表达数量性状位点(eQTL)来识别,并确定哪些变异同时存在于GWAS和eQTL信号之下。然而,大多数分析只考虑边缘eQTL信号,而不是将该信号分解为多个条件独立的每个基因信号。eQTL可以作为GWAS中识别的众多非编码遗传关联之间的联系,并通过与基因表达调控的关联直接对常见疾病产生易感性。eQTL映射研究的结果能用于识别各种复杂表型的GWAS基因和致病突变位点。与主要eQTL相比,条件eQTL在组织中的共享频率较低,并且像组织和细胞类型特异性eQTL一样,它们调节的基因通常更远端。条件独立的eQTL可能有助于组织特异性或其他背景特异性基因调节。疾病风险可能通过条件eQTL介导的一种机制就是突变体破坏组织特异性的增强子,导致相关eGene仅在增强子特异性的组织中失调。
意义:
阐明条件eQTL在精神分裂症(SCZ)病因学中的作用。量化了从表观基因组数据推断出的启动子和增强子功能基因组元素中主要和条件eQTL的富集。通过对具有多个独立eQTL的基因进行一系列“all-but-one”条件分析,分离出每个独立的eQTL信号,然后评估所有eQTL关联信号与精神分裂症GWAS信号之间的重叠。
结果1 条件eQTL的识别
作者利用467例欧洲病例对照样本识别了12,813个主要和16,082个条件eQTL,总共28,895个独立的eQTL(如下图A)。对于每个eQTL影响表达的基因数量的分布,大多数eQTL对单个基因具有特异性,只有一小部分eQTL(1.47%)影响多个基因,最多有6个基因受单个eQTL影响。对于每个基因,观察来自HBCC和ROSMAP死后脑组中主要和条件eQTL重复情况。主要和条件eQTL,ROSMAP中真实关联(p1)的估计比例分别为0.57和0.26,HBCC p1为0.46和0.20,所以主要eQTL重复比条件eQTL更强。ROSMAP中的RNA-seq数据中的重复率略高于HBCC。
结果2 主要和条件eQTL的基因组特征
作者首先分析了主要或条件eQTL位置与到基因(转录起始位点)TSS距离之间的关系。发现主要eQTL比条件eQTL更接近转录起始位点,主要eQTL中值位于在距TSS距离 70.4 kb处,条件eQTL中值位于距离302 kb处(如下图)。主要和条件eQTL分别有8.1%和2.5%位于TSS的3 kb以内。作者描述了每个基因的独立eQTL数量与三种不同基因组特征之间的关系:独立eQTL数量与基因长度、LD数量呈正相关,与基因约束得分呈负相关。作者通过线性混合模型方差分量分析来检验由顺式区域SNP或cis-SNP遗传力解释基因表达的方差。发现了估计的顺式遗传力对独立eQTL的数量有很强的影响,在具有cis-SNP遗传性的联合模型中,基因长度,LD区块数量和基因约束对eQTL数量的主要影响是显著的。
作者通过利用来自单细胞RNA-seq的6种DLPFC细胞类型和来自BrainSpan atlas DLPFC 8种发育期的RNA-seq数据计算出了来自Genotype-Tissue Expression(GTEx) 53个组织的鲁棒表达特异性度量(Tau),这能衡量条件eQTL的基因是否表现出更大的环境特异性。作者发现eQTL数量与组织、细胞类型和发育时间点的特异性呈正相关,并且这三个Tau集合都是相互关联的(如下图)。
结果3 表观遗传富集分析
作者评估了脑活性启动子(TssA)和增强子(整合Enh和EnhG)状态的初级和条件性eQTL的富集,以及来自DLPFC样本子集的H3K4me3和H3K27ac神经元(NeuN +)和非神经元(NeuN-)ChIP-seq峰的富集。H3K4me3和H3K27ac ChIP-seq峰的重叠用作活性启动子的代表,并且不与H3K4me3峰重叠的H3K27ac峰用作增强子的(相对非特异性)代表。主要和条件eQTL在REMC脑和CMC DLPFC组织的启动子和增强子染色质状态中均显著富集,在PFC神经元(NeuN+)启动子和增强子中总体观察到最大的富集。随着eQTL级数的条件增加,所有组织/细胞类型的活性启动子富集明显减少,在下图A中REMC大脑和下图C中 PFC 神经元增强子富集略有下降或在下图B中REMC脑特异性反应保持水平;D中虽然在非神经元核(NeuN)启动子和增强子中eQTL也有显著的富集,在非神经元PFC细胞核中,随着eQTL级数的增加,没有观察到活性启动子的显著减少而增强子富集水平稳定这种趋势。当通过解释表达的方差(R2)对eQTL进行分层并比较每个R2二进制内eQTL级数的富集时,也观察到了相同的总体模式。
结果4 eQTL与SCZ GWAS共定位
作者进行了共定位分析,以评估精神分裂症eQTL和GWAS信号重叠的程度,并从GWAS关联中识别假设的致病基因。217个基因座中共有114个含有346个基因的主要和/或条件eQTL,其中110个基因只有一个eQTL, 236个基因有多个独立的eQTL。作者使用R包coloc2用于贝叶斯推断每个基因顺式区域的两组汇总统计之间的共定位,使用coloc2测试了GWAS和所有eQTL汇总统计数据之间的联合定位。对于具有条件性eQTL重叠SCZ GWAS基因座的基因,评估来自“all-but-one”条件性eQTL分析的汇总统计数据与GWAS信号的共定位(如下图)。只有分离了主要eQTL和条件eQTL信号,才能实现与GWAS信号的共定位。
在下图A中,以基因IREB2为例,条件eQTL (rs7171869)被认为与该位点的GWAS信号后验概率(PPH4)为0.94。GWAS p值与条件eQTL p值的相关性高于GWAS和主要eQTL p值,下图B中与非条件eQTL信号或主要eQTL信号相比,基因座的GWAS信号更接近条件eQTL信号。作者发现40个基因座包含有eQTL和GWAS信号共定位的强有力证据,后验概率为H4(PPH4) >0.8 。对于40个共定位基因座中的其中6个,条件eQTL比主要eQTL有更有力的证据表明与GWAS支持共定位,显示出条件eQTL共定位证据的基因包括SLC35E2, PROX1-AS1 ,SDAD1P1, STAT6, IREB2。也有一些基因座的复杂共定位模式的出现,例如三个基因座显示出与一个基因的主要eQTL和另一个基因的条件eQTL共定位的证据。
结果5 与以往的共定位分析比较
在先前的CMC研究中实施的GWAS-eQTL共定位分析并使用非条件eQTL汇总统计获得了18个共定位基因座,占所测得的108个全基因组重要基因座中的17%。作者通过all-but-one条件共定位分析,重复了他们的大多数研究结果并识别了另外13个共定位实例,之前的研究对于eQTL和GWAS数据的定性比较似乎不支持共定位,虽然最显著的GWAS关联和最显著的eQTL在物理上接近,但两个指针SNP之间的LD较低(r2~0.2-0.4)。作者使用coloc2和相同的SCZ GWAS位点,将条件共定位结果与非条件eQTL分析结果进行了比较,条件和非条件coloc2结果是高度一致的。条件性eQTL共定位在所有共定位实例中占很大比例(~15%),还可以反映特定环境的差异表达,这可能暗示与疾病病因相关的细胞类型,组织类型和发育阶段。
Reference:
Landscape of Conditional eQTL in Dorsolateral Prefrontal Cortex and Co-localization withSchizophrenia GWAS
生信人整理的套路文章,大家还是有很多没有发送电子邮箱,现在提供百度云链接,欢迎购买的童鞋去下载,谢谢。(阅读原文,提取码:it8z)
欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史