今天小编为大家带来一篇今年八月份发表在Nature genetics[IF :38.333]上的一篇关于映射基因型结构到细胞类型的文章,利用GWAS研究疾病潜在机制和治疗方法,阐明常用的降压和肾保护药物的作用机制,确定了肾脏疾病的药物重置。
Mapping the genetic architecture of human traits to cell types in the kidney identifies mechanisms of disease and potential treatments

背景介绍
慢性肾病影响着全世界超过8亿人。全世界范围内,每60个人中就有一人死于肾脏疾病,因此迫切需要新的治疗方法。在人类致病基因证据的支持下,正在研发的药物靶点获得批准的可能性是其他药物的两倍,这凸显了了解疾病遗传学的重要性。
名词解释
- eQTL(expression Quantitative Trait Loci):表达数量性状位点
- GWAS(genome-wide association studies):全基因组关联研究
- LD( linkage disequilibrium):连锁不平衡
- eGFR(estimated glomerular filtration rate):估算肾小球滤过率
- PT(proximal tubule):近端小管
- eQTL(cf):eQTL cell fraction
- eQTL(ci):‘cell-typeinteracting’ eQTLs
数据和方法
eQTL data:http://susztaklab.com/eQTLci/index.php
Figshare:https://doi.org/10.6084/m9.figshare.14718015.v1
RNA-seq and human kidney snATAC-seq data:GSE173343;GSE115098;GSE172008
http://susztaklab.com/HumanKidneysnATAC/
http://susztaklab.com/human_kidney/igv/
代码:https://github.com/shengxin321/HumanKidney_eQTL_and_snATAC-seq
内容和结果
一、显微解剖人肾样本的细胞组分eQTL
- 收集303个微量解剖的人肾小球和359个小管样本的基因型和RNA-seq数据。利用CIBERSORTx反褶积估计细胞组分,然后使用体积和细胞分数调整模型鉴定eQTL。最初的cis-eQTL分析分别在肾小管和肾小球样本中鉴定了3599和5871个eGene(Fig.1a)。
- 接下来分析了359个近小管标本中各类细胞的占比和303个肾小球标本中各类细胞的分布。不出意料,近端小管(PT)细胞和肾小球内皮细胞分别是两类组织中最常见的细胞类型(Fig.1bFig.1c)。
- 最终的eQTL细胞分数模型包括通过表达残差因子的概率(PEER)估计来估计潜在变量调整。该分析在小管和肾小球样本中分别鉴定了9,209和10,106个eGenes(Fig.1d,e)。
- 另外,观察到在625个(功能编码缺失)肾病基因中,有303个被鉴定为eGenes。
- GO分析表明,eGenes富集在代谢过程中。在eQTL研究中,对已发表的GTEx数据中的48个组织进行的meta分析显示,有大量共有的eGenes 39,但也有1309个小管特异性和1458个肾小球特异eGene(Fig.1fg)。

Fig.1 Cell-fraction-adjusted eQTLs of human kidney samples 二、定义细胞类型依赖的eQTLs
- 为了识别以细胞类型依赖的方式调控基因表达的细胞类型相互作用的eQTL,作者进行了线性回归分析,模拟了细胞组分和基因型之间的相互作用(Fig.2a)。例如,G等位基因剂量较高的个体的肾脏(SNP rs4968146)显示,PT细胞组分与ABR表达呈负相关,表明细胞类型依赖于基因类型-基因表达相互作用(Fig.2b)。
- 为了确定rs4968146重叠基因组区域(补充表9)在调节ABR表达中的作用,我们在培养的人类胚胎肾细胞(HEK293)中进行了基于CRISPR的基因组编辑。该区域缺失后ABR表达明显降低(Fig.2c)。
- 总之,在23种肾细胞类型中,通过评估基因型和细胞分数相互作用的重要性,我们分别在肾小管和肾小球样本中鉴定了1613和713个蛋白编码的eQTL(ci)基因(Fig.2d)。
- 最后,为了描述eQTL(ci)的细胞类型特异性,作者使用多变量自适应收缩方法检测了肾脏细胞类型间的eQTL(ci)共享(Fig.2e)。
Fig.2 Cell-type-dependent activities of genetic variants on gene expression 三、人类肾脏的单细胞分辨率调节图
- 为了在细胞分辨率上表征基因调控区,我们利用高通量测序(snATAC-seq)信息对人类肾细胞转座酶可及染色质进行了单核分析(Fig.3a)。
- 通过比较每个簇中启动子区域的读取密度,作者根据先前确定的细胞类型标记将簇与已知的细胞类型相匹配(Fig.3bc)。
- 接下来,通过比较簇间的开放染色质区域生成染色质差异可及区域(DAR)列表,确定60661个细胞类型特异性峰(Fig.3d)。
- 估计相关细胞类型特异性开放染色质区域中eQTL(ci)变异的富集(Fig.3e)。
Fig.3 Single-cell resolution regulatory maps for the human kidney 四、内表型来源于相同的细胞类型
为了优先考虑特定肾脏特征和疾病(如eGFR和高血压)的潜在驱动细胞类型,首先根据scRNA-seq数据对每种细胞类型中每个基因的表达特异性进行排序。
- 从每十分位基因的GWAS汇总统计数据中评估了分割遗传力富集。随着PT细胞基因表达特异性的增加,eGFR SNP遗传力的增加(Fig.4a)。收缩压(SBP)与远端曲小管(Fig.4b)、集合管主细胞和内皮细胞(Fig.4c)之间也存在类似的正相关关系。
- 接下来,进行基因组注释多标记分析(MAGMA)中实施的广义基因集富集分析,以评估与肾脏相关表型的基因水平遗传关联是否随着细胞类型特异性的增加而增加。作者分析了24种不同的GWAS性状(Fig.4d)。
Fig.4 Single-cell annotation highlights cell type convergence of kidney endophenotypes 五、了解肾功能和血压
- 对可能导致特定肾内表型变异的基因进行了优先排序。利用贝叶斯共定位测试整合6个肾脏相关性状和肾脏显微解剖室eQTL(cf)数据,作者在肾小管中鉴定了240个共定位蛋白编码基因,在肾小球室中鉴定了230个基因。Fig.5a说明了eGFR和SBP优先基因在整个基因组的肾小球和肾小管间隔中的分布。
- 使用6个肾脏相关性状的GWAS汇总数据和eQTL(ci)数据重复进行贝叶斯共定位分析。作者优先考虑了61个可能的因果蛋白编码基因,其中6个肾内表型和细胞类型特异性基因调控的变异。通过GWAS的气泡图分析eGFR(上)和SBP(下)共定位的11个优先细胞类型特异性eQTL(ci)基因(Fig.5b)。

Fig.5 Comprehensive gene prioritization provides new mechanistic insights into kidney function and blood pressure regulation 六、CKD和高血压的治疗见解
- 最近SBP GWAS在17号染色体rs4292上发现了一个遗传信号。eQTL分析表明,在小管样本中,同样的SNP与ACE表达显著相关。
- 对肾区室和46个GTEx组织中这种eQTL关联的meta分析表明,rs4292对肾小管区室中的ACE(M=1)具有最显著的eQTL效应。此外,该信号与PT eQTL(ci)共定位,具有较高的可信度(Fig.6a)。
- 单细胞开放染色质可及性分析突出了PT细胞ACE周围rs4292开放染色质区域之间的强相关性(Fig.6b)。
- 此外,使用基于缺口k-mer支持向量机的方法,计算量化这种变体可能的因果调节效应。发现转录因子结合活性显著高于T等位基因(Fig.6c)。
- 通过考虑ACE和AGE,作者识别了200多个肾脏功能和高血压基因。这些基因的发现可以帮助识别潜在的药物(Fig.6def)。
- 利用药物基因相互作用数据库,作者确定了54个基因,这些基因可以被已经批准的药物靶向。

Fig.6 Multi-omic integrative annotation highlights the therapeutic targets for CKD and hypertension 结论和展望
在这项研究中,作者生成了一个全面的多组学数据集,并使用正交分析方法来注释肾脏相关的表型。优先考虑了182多个与肾功能有关的致病基因和88个与高血压有关的致病基因,确定了肾脏中这些疾病的核心基因。功能注释表明代谢在肾脏疾病和高血压血管生成中可能的作用。最后,分析阐明了最常用的抗高血压和肾脏保护药物作用的关键基因基础,并强调了大量可能对高血压和CKD有效的其他药物。